数据集:

olivierdehaene/xkcd

语言:

en

计算机处理:

monolingual

大小:

1K<n<10K

语言创建人:

other
英文

"XKCD"的数据集卡片

数据集概述

XKCD是从 https://explainxkcd.com 文章中提取的所有XKCD漫画及其转录和解释。

数据集结构

数据实例

  • id : 1
  • title : 油桶-第一部分
  • image_title : 油桶-第一部分
  • url : https://www.xkcd.com/1
  • image_url : https://imgs.xkcd.com/comics/barrel_cropped_(1).jpg
  • explained_url : https://www.explainxkcd.com/wiki/index.php/1:_Barrel_-_Part_1
  • transcript : [一个男孩坐在一个漂浮在海洋中的油桶里。] 男孩: 我想知道我接下来会漂到哪里? [一个较小的画框,从远处看到男孩坐在油桶里。油桶漂向远方。没有其他 任何可见的东西。]
  • explanation : 这个漫画展示了一个小男孩漂浮在一个没有尽头的海洋中的油桶里。它评论了人们有时表现出的不太可能的乐观和天真。男孩完全迷失了方向,似乎无望地孤单一人,对这种情况没有任何计划或控制。然而,与其害怕或担心,他却充满好奇心:"我想知道我接下来会漂到哪里?"尽管这并不一定是这个漫画中的情景,当人们在长时间内无法解决问题时,他们经常表现出这种行为;他们可能已经放弃希望或发展出一种漫不经心的态度作为一种应对机制。标题文字展开了哲学内容,男孩代表了普通人:在生活中漫无目的地徘徊,心存乐观,始终机会主义,并且对未来一无所知。男孩的孤立也可以代表我们在生活中经常感到迷失的方式,永远不知道自己身在何处,相信没有人可以依靠。这个漫画也可以反映出Randall对于创造xkcd的感受;不确定网络漫画会朝着什么方向发展,但对它最终成为今天我们所知道的热门网络漫画充满希望。这是一个由随机发布的六幅连环画中的第一幅连环画。该系列以一个与很快成为xkcd棒人风格不一致的角色为特色。该角色在1110: Click and Drag中有一个对这个漫画的参考,位于1北,48东。在Randall发布xkcd的完整的男孩和他的油桶故事之后,似乎清楚地应该将原始的雪貂故事作为油桶系列的一部分包括在内。可以在此处找到完整的系列。它们按照Randall为上述短篇故事选择的顺序列出如下:

数据字段

  • id
  • title
  • url : xkcd.com URL
  • image_url
  • explained_url : explainxkcd.com URL
  • transcript : 漫画的英文文本转录
  • explanation : 漫画的英文解释

数据集创建

该数据集是从explainxkcd.com和xkcd.com获取的。因此,该数据集的转录和解释字段受到知识共享署名-相同方式共享3.0许可证的许可,而图像本身受到知识共享署名-非商业性2.5许可证的许可。

请参阅explainxkcd.com的 Copyrights 页面了解更多解释。

更新

您可以使用 scrapper.py 脚本更新数据集。首先安装依赖项:

pip install aiolimiter aiohttp beautifulsoup4 pandas

然后运行脚本:

python scrapper.py

使用数据时的注意事项

由于数据是从其他网站获取的,因此有可能一些字段缺失原始数据的一部分。

其他信息

许可信息

该数据集的转录和解释字段受到知识共享署名-相同方式共享3.0许可证的许可,而图像受到知识共享署名-非商业性2.5许可证的许可。

贡献

感谢 @OlivierDehaene 添加了这个数据集。