数据集:

qed_amara

任务:

翻译

计算机处理:

multilingual

大小:

100K<n<1M

语言创建人:

found

批注创建人:

found

源数据集:

original
英文

QedAmara 数据集卡片

数据集概要

要加载一个不在配置文件中的语言对,你只需要指定语言代码作为pairs。您可以在Dataset Description的主页部分中找到有效的语言对: http://opus.nlpl.eu/QED.php 例如

dataset = load_dataset("qed_amara", lang1="cs", lang2="nb")

支持的任务和排行榜

[需要更多信息]

语言

数据集中的语言有:

  • aa
  • ab
  • ae
  • aeb
  • af
  • aka: ak
  • amh: am
  • an
  • ar
  • arq
  • arz
  • as
  • ase
  • ast
  • av
  • ay
  • az
  • ba
  • bam: bm
  • be
  • ber
  • bg
  • bh
  • bi
  • bn
  • bnt
  • bo
  • br
  • bs
  • bug
  • ca
  • ce
  • ceb
  • ch
  • cho
  • cku
  • cnh
  • co
  • cr
  • cs
  • cu
  • cv
  • cy
  • da
  • de
  • dv
  • dz
  • ee
  • efi
  • el
  • en
  • eo
  • es
  • et
  • eu
  • fa
  • ff
  • fi
  • fil
  • fj
  • fo
  • fr
  • ful: ff
  • ga
  • gd
  • gl
  • gn
  • gu
  • hai
  • hau: ha
  • haw
  • haz
  • hb: ?
  • hch
  • he
  • hi
  • ho
  • hr
  • ht
  • hu
  • hup
  • hus
  • hy
  • hz
  • ia
  • ibo: ig
  • id
  • ie
  • ik
  • inh
  • io
  • iro
  • is
  • it
  • iu
  • ja
  • jv
  • ka
  • kar
  • kau: kr
  • kik: ki
  • kin: rw
  • kj
  • kk
  • kl
  • km
  • kn
  • ko
  • ksh
  • ku
  • kv
  • kw
  • ky
  • la
  • lb
  • lg
  • li
  • lin: ln
  • lkt
  • lld
  • lo
  • lt
  • ltg
  • lu
  • luo
  • luy
  • lv
  • mad
  • mfe
  • mi
  • mk
  • ml
  • mlg: mg
  • mn
  • mni
  • mo: Moldavian (过时标签; 首选值: Romanian; Moldavian; Moldovan (ro))
  • moh
  • mos
  • mr
  • ms
  • mt
  • mus
  • my
  • nb
  • nci
  • nd
  • ne
  • nl
  • nn
  • nso
  • nv
  • nya: ny
  • oc
  • or
  • orm: om
  • pam
  • pan: pa
  • pap
  • pi
  • pl
  • pnb
  • prs
  • ps
  • pt
  • que: qu
  • rm
  • ro
  • ru
  • run: rn
  • rup
  • ry: ?
  • sa
  • sc
  • scn
  • sco
  • sd
  • sg
  • sgn
  • sh
  • si
  • sk
  • sl
  • sm
  • sna: sn
  • som: so
  • sot: st
  • sq
  • sr
  • srp: sr
  • sv
  • swa: sw
  • szl
  • ta
  • te
  • tet
  • tg
  • th
  • tir: ti
  • tk
  • tl
  • tlh
  • to
  • tr
  • ts
  • tt
  • tw
  • ug
  • uk
  • umb
  • ur
  • uz
  • ve
  • vi
  • vls
  • vo
  • wa
  • wol: wo
  • xh
  • yaq
  • yi
  • yor: yo
  • za
  • zam
  • zh
  • zul: zu

数据集结构

数据实例

这里有一些问题和事实的示例:

数据字段

[需要更多信息]

数据拆分

[需要更多信息]

数据集创建

策划理由

[需要更多信息]

源数据

[需要更多信息]

初始数据收集和规范化

[需要更多信息]

谁是源语言的产生者?

[需要更多信息]

注释

[需要更多信息]

注释流程

[需要更多信息]

谁是标注者?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据时的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划

[需要更多信息]

许可信息

[需要更多信息]

引用信息

[需要更多信息]

贡献

感谢 @abhishekkrthakur 添加了这个数据集。