数据集:

winvoker/turkish-sentiment-analysis-dataset

英文

数据集

此数据集包含来自多个参考来源的正面、负面和中性句子。在大多数情感模型中,仅有两个标签:积极和消极。然而,用户输入可能是完全中性的句子。对于这种情况,我找不到相应的数据。因此,我创建了这个包含3个类别的数据集。积极和消极句子如下所示。中性示例是从土耳其维基百科转储中提取的。此外,还添加了一些随机文本输入,例如“Lorem ipsum dolor sit amet.”。

共有492,782个带有标签的句子,其中10%用于测试。

Türkçe Duygu Analizi Veriseti (土耳其情感分析数据集)

此数据集包含来自多个参考来源的正面、负面和中性句子。很多数据集只包含积极和消极句子。然而,用户输入可能是中性的。我很难找到这种情况下的土耳其语数据集。因此,我创建了这个包含3个类别的数据集。正面和负面的例子在参考部分中列出。中性句子来自维基百科的转储数据。此外,还随机添加了一些中性文本输入,如“Lorem ipsum dolor sit amet.”。

共有492,782个带有标签的句子,其中10%用于测试。

参考

您可以通过LinkedIn与我联系。 https://www.linkedin.com/in/batuhanayhan/