为什么数据污染对LLM来说是一个大问题
康奈尔大学推出新的社交机器人,更柔软,更人性化
所以,能动手就别吵吵了
字节跳动旗下团队推出的免费AI英语写作助手
StabilityAI推出的文本到图像生成AI
GitHub AI编程工具
Adobe最新推出的AI图片生成工具
AI艺术和创意辅助平台
数据集:
Someman/hindi-summarization
任务:
语言:
大小:
许可:
《印地语文本短篇和大篇摘要语料库》是从印地语新闻网站收集的约18万篇文章及其标题和摘要的集合。
这是印地语中第一个可以用于基准测试文本摘要模型的数据集。该数据集与《印地语文本短篇摘要语料库》同时发布,两者不包含相同的文章。
数据集保留了文章中的原始标点符号、数字等。
语言为印地语。
MIT
https://www.kaggle.com/datasets/disisbig/hindi-text-short-and-large-summarization-corpus?select=test.csv
作者:
数据集大小:
143.6 MB