模型:
yiyanghkust/finbert-esg-9-categories
ESG分析可以帮助投资者确定企业的长期可持续性,并识别相关风险。FinBERT-esg-9-categories是一个在大约14,000个企业ESG报告和年度报告中进行微调的FinBERT模型,用于分类文本。
finbert-esg-9-categories将文本分类为九个细分的ESG主题:气候变化、自然资本、污染和废物、人力资本、产品责任、社区关系、公司治理、商业道德和价值观,以及非ESG。该模型与 finbert-esg 相辅相成,后者将文本分类为四个粗粒度的ESG主题(环境、社会、治理或无)。
可以在 here 找到九个细分的ESG主题定义的详细描述,以及每个主题的一些示例、训练样本和模型的性能。
输入:一段文本。
输出:气候变化、自然资本、污染和废物、人力资本、产品责任、社区关系、公司治理、商业道德和价值观,或非ESG。
您可以使用此模型和转换器管道进行细分的ESG 9个类别的分类。
from transformers import BertTokenizer, BertForSequenceClassification, pipeline finbert = BertForSequenceClassification.from_pretrained('yiyanghkust/finbert-esg-9-categories',num_labels=9) tokenizer = BertTokenizer.from_pretrained('yiyanghkust/finbert-esg-9-categories') nlp = pipeline("text-classification", model=finbert, tokenizer=tokenizer) results = nlp('For 2002, our total net emissions were approximately 60 million metric tons of CO2 equivalents for all businesses and operations we have financial interests in, based on its equity share in those businesses and operations.') print(results) # [{'label': 'Climate Change', 'score': 0.9955655932426453}]
如果您在学术工作中使用了该模型,请引用以下论文:
Huang, Allen H., Hui Wang, and Yi Yang. "FinBERT: A Large Language Model for Extracting Information from Financial Text." Contemporary Accounting Research (2022).