Meta近日发布了一个名为NotebookLlama的项目,该项目旨在复制谷歌NotebookLM中广受欢迎的生成播客功能。NotebookLlama主要利用Meta自家的Llama模型进行大部分处理工作。
与NotebookLM类似,NotebookLlama能够生成类似播客对话风格的文本摘要,这些摘要基于用户上传的文本文件生成。具体流程上,NotebookLlama首先会从文件中创建一个转录文本,例如将PDF格式的新闻文章或博客文章转换为文字。随后,它会在转录文本中加入更多的戏剧性元素和对话中断,再将处理后的文本输入到开源的文本转语音模型中。
然而,NotebookLlama的生成效果并不如NotebookLM。据报道,NotebookLlama生成的语音具有明显的机器人特质,且在某些时刻会出现两个声音重叠的现象。
负责该项目的Meta研究人员指出,语音质量的问题可以通过使用更强大的模型来改善。他们在NotebookLlama的GitHub页面上写道:“文本转语音模型是声音自然程度的主要限制因素。此外,另一种撰写播客的方法是让两个智能体围绕感兴趣的主题进行辩论,并编写播客大纲。目前,我们仅使用一个模型来编写播客大纲。”
NotebookLlama并非首个尝试复制NotebookLM播客功能的项目,但其他项目的成功程度各不相同。值得注意的是,目前尚未有任何项目,包括NotebookLM本身,能够完全解决AI生成内容中普遍存在的“幻觉”问题,即AI生成的播客内容中不可避免地会包含一些虚构的信息。