数据集:

sms_spam

英文

数据集卡片:[数据集名称]

数据集摘要

SMS垃圾短信收集v.1是一份公开的带有标记的SMS短信数据集,用于移动电话垃圾短信研究。该数据集由5574条英语实际非编码信息组成,根据其是否合法(非垃圾短信)进行标记。

支持的任务和排行榜

[需要更多信息]

语言

英语

数据集结构

数据实例

[需要更多信息]

数据字段

  • sms: 短信内容
  • label: 标识短信是非垃圾短信还是垃圾短信,非垃圾短信为ham

数据切分

[需要更多信息]

数据集创建

策划理由

[需要更多信息]

源数据

初始数据收集和规范化

[需要更多信息]

语言产生者是谁?

[需要更多信息]

注释

注释过程

[需要更多信息]

注释者是谁?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据集的社会影响

[需要更多信息]

偏差讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

@inproceedings{Almeida2011SpamFiltering, title={Contributions to the Study of SMS Spam Filtering: New Collection and Results}, author={Tiago A. Almeida and Jose Maria Gomez Hidalgo and Akebo Yamakami}, year={2011}, booktitle = "Proceedings of the 2011 ACM Symposium on Document Engineering (DOCENG'11)",}

贡献者

感谢 @czabo 添加了该数据集。