康奈尔大学推出新的社交机器人,更柔软,更人性化
为什么数据污染对LLM来说是一个大问题
所以,能动手就别吵吵了
OpenAI旗下AI对话工具
AI图像和插画生成工具,测试测试测试测试测试测测试
StabilityAI推出的文本到图像生成AI
GitHub AI编程工具
百度推出的基于文心大模型的AI对话互动工具
科大讯飞推出的类ChatGPT的讯飞星火认知大模型
阿里旗下推出的AI搜索助手
模型:
ai-forever/rugpt3large_based_on_gpt2
任务:
类库:
语言:
其他:
该模型是由 SberDevices 团队使用transformers库进行训练的,使用长度为1024的序列,在80B的标记上进行了3个时期的训练。之后,模型使用长度为2048的序列进行了1个时期的微调。
全面的训练时间约为14天,使用128个GPU进行1024上下文训练,以及几天使用16个GPU进行2048上下文训练。测试集上的最终困惑度为13.6。
作者:
数据集大小:
5.76 GB