数据集:
hebrew_this_world
语言:
he计算机处理:
monolingual大小:
1K<n<10K语言创建人:
found批注创建人:
expert-generated源数据集:
original许可:
agpl-3.0HebrewThisWorld 是一个数据集,包含了由Uri Avnery编辑的报纸《This World》的2028期,发行于1950年至1989年之间。该数据集采用AGPLv3许可发布。
数据注释:
语言建模
希伯来语
以“,”为分隔符的csv文件
示例:
{ "issue_num": 637, "page_count": 16, "date": "1950-01-01", "date_he": "1 בינואר 1950", "year": "1950", "href": "https://thisworld.online/1950/637", "pdf": "https://olam.eu-central-1.linodeobjects.com/pdfs/B-I0637-D010150.pdf", "coverpage": "https://olam.eu-central-1.linodeobjects.com/pages/637/t-1.png", "backpage": "https://olam.eu-central-1.linodeobjects.com/pages/637/t-16.png", "content": "\nלפיד\nהנוער ־ בירושלים צילומים :\n\nב. רותנברג\n\nוזהו הלפיד\n...", "url": "https://thisworld.online/api/1950/637" }
train | |
---|---|
corpus | 2028 |
[需要更多信息]
[需要更多信息]
源语言制作者是谁?[需要更多信息]
[需要更多信息]
注释者是谁?研究人员
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
GNU AGPLv3+
这是自由软件,您可以在一定条件下重新分发它。
本程序是自由软件:您可以依照自由软件基金会颁布的GNU Affero General Public License条款的版本3或(您可以选择)任何以后版本的条件,自由地获取、使用和重新分发此程序。
此程序是基于有用性,在没有明示或暗示的情况下提供,但没有任何担保。详见GNU Affero General Public License获取更多详细信息。
如果你没有收到GNU Affero General Public License的副本,请参阅 http://www.gnu.org/licenses/ 。
感谢 @lhoestq 和 @imvladikon 提供此数据集。