Skip to content
/ chinese-chatterbot Public
  • Notifications You must be signed in to change notification settings
  • Fork 0
  • Star 8

开放领域中文聊天机器人

8 stars 0 forks Branches Tags Activity
Star
Notifications You must be signed in to change notification settings

yukixuen/chinese-chatterbot

Branches Tags

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
chinesechatterbot/chinesechatterbot
chinesechatterbot/chinesechatterbot
 
 
README.md
README.md
 
 

Repository files navigation

chinese-chatbot

开放领域中文聊天机器人

申明:跨专业小白菜课余第一次实践 ⁄(⁄ ⁄•⁄ω⁄•⁄ ⁄)⁄,兼容性拓展不足(翻译:预料兼容性bug良多),欢迎讨论,共同学习。
搭建环境:python3.6.8 + MongoDB。
设计时借鉴了 英文chatterbot,特此申明。
本项目代码注释繁多,敬请谅解。
20191203:目前上传的是整体项目文件,作为项目文件在spyder或pycharm等中打开即可使用。日后完善过再打包。

1. 架构

/chinesechatterbot
--||response_adapter:应答逻辑接口
--||--init.py
--||--match_based.py:继承父类,基于匹配检索的应答逻辑类。
--||--response_adapter.py:父类,可拓展。日后可拓展基于知识图谱、情绪识别等的应答逻辑。
|--init.py
|--chatterbotbody.py:chatterbot主体,主程序请在这里运行。
|--preparecorpus.py:载入语料请在这里运行。
|--MongoDBstorage.py:数据库接口,采用MongoDB,当时没有考虑代码复用,就没有写拓展……
|--conversation.py:定义Statement类。本包基本数据结构。
|--response_selection.py:选择候选应答函数,被response_adapter调用。
|--compare.py:计算语句相似性函数。
|--search.py:定义search类。搜索数据库,被response_adapter调用。
|--simhash.py:simhash类。被match_based调用。
|--utils.py:其它。
|--requirements.txt:所需环境,比较重要的包是jieba。
|--stopword.txt:中文停用词。
|--signstopword.txt:停用符号。
说明:
当前实现的应答逻辑接口MatchBased类采用 simhash计算语句相似性。

2. 语料库训练

数据库

暂只实现MongoDB数据库,该非关系型数据库搭建方便、界面友好,容易上手,建议下载。
MongoDB安装教程
MongoDB可视化界面compass下载地址

语料库

来自 中文公开聊天语料库。
按照该git项目生成txt文档,将该txt文档目录传入preparecorpus.py中CorpusLoader类。载入及训练方法已在preparecorpus.py文件中写明。

注意:建议先加载chatterbot.txt和qingyun.txt语料库,训练过程较短;微博和贴吧语料巨大且噪音多,训练从半天到一天不等,训练时务必开启loadCorpus函数filtertrash参数。

3. 开始对话

进入chatterbotbody.py中,一句简单的get_response(input)即可开始对话!
样例:

You: 你好
chatbot.name: 你好吗
You: 我不好
chatbot.name: 不好就不好啦,说这么大声是要全世界的人都听到吗
You: 我难过呀
chatbot.name: 慧慧一直都是一个人,特别害怕孤单
You: 你没有生命,也没有情绪,怎么会害怕孤单呢
chatbot.name: 切,这么点事会怕?
You: 我也不怕孤独,只怕自己不在前进
chatbot.name: 你不会孤独的

如果需要在控制台输出对话日志进行调试,请在实例化chatterbotbody.py中的chatbot类时传入参数showlog=True。

About

开放领域中文聊天机器人

Topics

python chatterbot chinese

Resources

Readme
Activity

Stars

8 stars

Watchers

3 watching

Forks

0 forks
Report repository

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%

Footer

© 2024 GitHub, Inc.

玻璃钢生产厂家红色玻璃钢雕塑规定西安肇庆玻璃钢卡通雕塑瑞丽市玻璃钢雕塑设计玻璃钢雕塑修补方法遵义花钵玻璃钢雕塑厂家玻璃钢卡通牛雕塑报价仿真玻璃钢卡通雕塑现货马鞍山玻璃钢景观雕塑设计山西高质量玻璃钢雕塑图片北京超市商场美陈销售公司商场美陈布置方案空间利用太原户内玻璃钢雕塑优势无锡玻璃钢雕塑定做欢迎来电古代玻璃钢卡通雕塑哪家便宜东营人物玻璃钢雕塑厂家深圳现代玻璃钢人物雕塑北京主题商场美陈哪里买成都玻璃钢雕塑制品厂芒市玻璃钢雕塑设计公司济南玻璃钢公园雕塑盐城专业玻璃钢雕塑厂家沈阳大型玻璃钢雕塑厂家挂在市政护栏的玻璃钢花盆北京户内玻璃钢雕塑定做价格安徽个性化玻璃钢雕塑销售厂家玻璃钢海洋雕塑哪家便宜玻璃钢瓜果雕塑哪里实惠安阳玻璃钢卡通雕塑定做饶阳玻璃钢人像雕塑玻璃钢卡通雕塑公仔定制香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化