practical_seq2seq
1.0.0
为了让想要尝试 seq2seq 模型的初学者更轻松。阅读我写的关于 seq2seq -实用 seq2seq 的文章,了解更多详细信息。
更新
对数据集进行调整,将未知标记的总体百分比降低到 3%,将词汇量增加到 8000 个,结果令人鼓舞。
询问 | 回复 |
---|---|
根据在线民意调查,唐纳德·特朗普赢得了昨晚的总统辩论 | 以为他是个笑话 |
特朗普竞选团队请永远不要删除此内容 | 他是个笑话 |
新的独家新闻与卡斯特罗有关,特朗普公司如何违反美国对古巴的禁运 | 特朗普是辩论的耻辱,媒体不是骗子 |
谁赢得了第一场总统辩论 | 特朗普将是一个男人更好的时代 |
只想住在 unk 那里一切都好十倍 | 我只是站在同一边,我觉得这是一个美好的时光 |
我忘记了她名字的小女孩把我吓坏了,可能永远都会这样,lmaooo | 她太可爱了,她太可爱了,她是个婊子 |
当天的问题 你认为谁赢得了昨晚的辩论 | 希拉里是特朗普的支持者,也是一个比女人有更好工作的女人 |
特朗普真是太尴尬了,他就像一个黑人孩子,却恰好是一个职业骗子和骗子 | 特朗普有很多钱才能建立一个伟大的国家 |
他妈的冷静下来 | 这就是我说的 |
看看特效团队的创作目的很有趣 | 哇,这是我见过的最好的事情 |
她的声音也很好 | 她是个好人 |
重要的还在这里 | 我不这么认为 |
一周以来我每天早上都喝南瓜香料蛋白奶昔,现在我什至都不能喝了 | 我也是,我刚刚得到它 |
lmao,我刚刚失业了,我什至不能早点离开去参加今天的 unk 视频 | 字面上是同一件事 |
嘿生日快乐祝你有美好的一天 | 谢谢 |
数据集中约 4% 的未知标记;词汇量8000。
询问 | 回复 |
---|---|
你什么时候让警察知道 | 你不知道你在说什么 |
你能做到 | 是的,我想是的 |
等等你是说我不欣赏吗 | 我知道你明白我的意思 |
你太糟糕了 | 是的,但我不是 |
不,我不这么认为 | 为什么不呢 |
他又在我们脸上撒尿了,我们只是接受而已 | 我不能 |
对不起,除了对不起,我不知道还能说什么 | 你为什么想成为 |
没人会抓到你,现在就进去吧 | 我无法回去 |
我可以离开吗 | 当然 |
好吧,我真的认为他有机会 | 我知道 |
你最好保持安静,沙地 | 住口 |
天哪,你吓死我了 | 这是怎么回事 |
好吧,我很抱歉,我真的很抱歉艾莉 | 没关系 |
我的女士,这出戏的结局会很糟糕,我会告诉 | 让我们离开这里 |
我会想念你的 | 不,你不是 |
你是什么意思 | 我不知道我不知道我的意思 |
天哪,这些人都疯了 | 我们不知道它们是什么 |
这不是约会 | 不,这是什么 |
你应该回家处理那个 | 我不能那样做 |
有什么问题吗 | 不不不 |