fungi_trait_circus_database 大菌輪「Trait Circus」数据集(统制形态) 最终更新日期:2022/12/26 ====
日语和英语
请暂时不要将此数据集用于学术目的(仅限非正式使用) 当前暂不适用于学术目的使用。
在个人网站 大菌輪 中,Atsushi Nakajima(中岛纯志)使用自然语言处理方法对真菌的描述文字进行半自动处理,提取与真菌形态、生态等相关的各种“形态(traits)”数据,以预先设定的“控制词(controlled term)”的形式进行整理,以方便统计和分析。 抽取方法已在《Niche Life》杂志中报告 こちらの記事 (未经同行评审)。 请注意,由于自动抽取的性质,可能会包含一定程度的错误。
控制词由“要素(element)”、“属性(attribute)”和“值(value)”三元组组成。 例如,“傘_色_黒”分别具有“傘”、“色”和“黒”的要素/属性/值。 在部分控制词中,要素和属性相同(如“生境”)。 供参考,前三个数据的要素为“子实体”、“傘”、“胞子”,属性为“颜色”、“形状”、“表面特征”,值为“褐色”、“光滑”、“黄色”。
此外,为了学习真菌分类学和辅助鉴定的目的,提供了基于这些数据的交互式可视化Web应用程序“ Trait Circus ”。 此数据集相当于该Web应用程序的原始数据,并包含未在Web应用程序中反映的信息,以适应容量等问题。
“论文3行总结” Atsushi/fungi_indexed_mycological_papers_japanese 、“识别形态总结” Atsushi/fungi_diagnostic_chars_comparison_japanese