模型:
NeuML/t5-small-txtsql
T5 small 经过微调的模型,用于生成 txtai 的SQL语句。该模型接受自然语言查询,并构建与txtai兼容的SQL语句。
txtai 支持自然语言查询
Tell me a feel good story Show me stories about wildlife Sports stories about hockey
和 SQL语句
select * from txtai where similar("Tell me a feel good story") and entry >= date('now', '-1 day')
该模型弥合了两者之间的差距,并支持带有筛选条件的自然语言查询。
Tell me a feel good story since yesterday Show me sports stories since yesterday with team equal Red Sox Breaking news summarized Breaking news translated to fr
这个模型是创建一个自定义查询语法的示例,可以被翻译为txtai可以理解的SQL语句。任何查询语法都可以被创建。该语法支持英语,但类似的策略可以用来支持其他语言。自然语言可以被翻译为函数、查询子句、列选择等等。
参见 t5-small-bashsql ,这是一个将Bash类命令翻译为txtai SQL的模型。
这个模型是使用可以 found here 的脚本进行训练的。
训练步骤如下:
python generate.py txtsql.csv python train.py txtsql.csv t5-small-txtsql