• 准备工具

1、开发语言:Python3

2、数据库:MongoDB

3、开源框架:Chatterbot

4、依赖类库:

  1. pip3 install chatterbot
  2. pip3 install spacy
  3. # 需要手动编译安装 en_core_web_sm(使用2.1版本)
  4. pip3 install jieba
  5. pip3 install colorama
  6. pip3 install pymongo
  • Chatterbot 介绍

About ChatterBot — ChatterBot 1.0.8 documentation 简单来说就是一个对话机器人框架

1、预处理器

对输入的文本作预处理,比如去掉一些不必要的空格

2、逻辑适配器

1)最佳匹配适配器

使用函数将输入语句与已知语句进行比较。一旦找到与输入语句最接近的匹配,它就使用另一个函数来选择该语句的一个已知响应。

2)时间适配器

询问关于当前时间的问题的语句

User: What time is it?

Bot: The current time is 4:45PM.

3)数学适配器

检查给定的语句,以查看它是否包含可以计算的数学表达式。如果存在,则返回包含结果的响应。这个适配器能够处理字和数字运算符的任意组合。

User: What is four plus four?

Bot: (4 + 4) = 8

4)特定响应适配器

如果聊天机器人接收到的输入与为此适配器指定的输入文本匹配,则将返回指定的响应。

如果出现低置信度,则直接返回具体的文本

比如输入人工客服,返回特定的响应:

  1. >>> 人工客服
  2. Robot (1) :
  3. 您好,正在转接人工客服,请稍后。

3、存储适配器

简单来说,存储适配器提供了一个接口,允许ChatterBot连接到不同的存储技术,不指定默认使用 SQLite 数据库存储聊天记录,会在执行程序的目录生成一个db.sqlite3文件

推荐是使用mongoDB作为存储适配器

还可以使用mysql:

4、过滤器

可以通过过滤器过滤一些非法的输入语句

5、比较算法

可以自定义一个比较算法,最后返回一个0-1之间的得分值

三、Chattbot算法与文本相似度

1、Chatterbot使用的算法

在对话生成方面,ChatterBot 使用了一种基于深度学习的序列到序列模型来生成回答。具体来说,它使用了一种叫做 LSTM(长短时记忆)的神经网络模型,将对话历史和用户输入转化为一个序列,然后根据先前的对话历史来预测下一个可能的回复。

2、文本相似度计算

将问句表示成一个高维向量,因为一段自然语言文本可能包含很多不同的词汇,每个词汇都对应一个维度。

假设我们有以下两句话:

可以请问你多大了吗?

你今年几岁了?

我们已经将它们表示为以下向量:

v1 = [1, 1, 0, 0, 1, 0, 0, 1, 0]

v2 = [0, 1, 1, 1, 1, 0, 0, 1, 0]

可以通过如下公式计算这两个向量的余弦相似度:

cos_sim(v1, v2) = (v1 • v2) / (||v1|| * ||v2||)

 

其中,“•”表示两个向量的点积,表示对应元素相乘之和。而“||v||”表示一个向量的模,即该向量的所有元素平方和的非负平方根。

按照上述公式计算得到两个向量的余弦相似度为 0.5,这说明这两句话在意义上比较相似。当用户输入一句与 v1 向量比较相似的话时,ChatterBot 可以将回答设置为“我的年龄是……”。

余弦相似度的取值范围是 [-1, 1],其中 1 表示两个向量完全相同,-1 表示两个向量方向完全相反,0 表示两个向量互相垂直。

四、利用chatterbot打造AI客服问答机器人

1)准备语料库

第一行为Question,第二行为answer。它支持json,txt,yml各种格式文件,以txt为例子:

比如有以下的一段对话:

Q:我不知道如何安装游戏。

A:您可以在我们的网站上找到安装说明,或者尝试卸载并重新安装游戏。

Q:我忘记了我的游戏账号密码。

A:请尝试通过我们的密码恢复选项重置您的密码。

存为txt格式直接就是:

我不知道如何安装游戏。

您可以在我们的网站上找到安装说明,或者尝试卸载并重新安装游戏。

我忘记了我的游戏账号密码。

请尝试通过我们的密码恢复选项重置您的密码。

这里记录为 corpus.txt 待会用到

2)利用jieba分词工具进行分词

# -*- coding: utf-8 -*-
import jiebafile_path = "corpus.txt"  # 将 your_file_path.txt 替换成您的文件路径
with open(file_path, "r", encoding="utf-8") as f:lines = f.readlines()new_lines = []
for line in lines:if line.strip():  # 判断是否为空行new_lines.append(line)text = ''.join(new_lines)word_list = jieba.cut(text)  # 进行分词
result = " ".join(word_list)  # 将分词结果合并为字符串,以空格隔开file_path = 'corpus_cut.txt'  # 将 your_file_path.txt 替换成您的文件路径
with open(file_path, mode='a', encoding='utf-8') as f:# 写入数据f.write(result+'\n')

官网文档并没有推荐使用jieba分词进行拟合度的优化,为什么要用jieba进行中文分词?

这也是我自己探索出来的,之前没用分词工具的时候,发现拟合度很差,后面猜测是框架的计算对中文不准确,对中文的分词效果很差,导致计算出来的词向量其实是误差很大的。中文没有像英文一样的明显的单词边界,因此需要使用专门的中文分词工具将中文文本分成有意义的词语,这样计算出来的词向量才是比较精准的。

Jieba 分词工具利用了统计算法和规则引擎的结合,通过分析中文文本中每个汉字与周围汉字的关系,来确定最可能的分词结果。这样可以大大提高分词的准确性,从而更好地反映出中文句子的含义。

3)训练数据

# -*- coding: utf-8 -*-
from chatterbot import ChatBot
from chatterbot.trainers import ListTrainer
import chatterbot.comparisons as comparisons
import chatterbot.response_selection as response_selection
import logginglogging.basicConfig(level=logging.INFO)chatbot = ChatBot("Ron", logic_adapters=[{'import_path': 'chatterbot.logic.BestMatch',"statement_comparison_function": comparisons.LevenshteinDistance,"response_selection_method": response_selection.get_first_response,'default_response': 'I am sorry, but I do not understand.','maximum_similarity_threshold': 0.90},{'import_path': 'chatterbot.logic.SpecificResponseAdapter','input_text': '人工客服','output_text': 'Ok, here is a link: http://chatterbot.rtfd.org'}],storage_adapter='chatterbot.storage.MongoDatabaseAdapter',database_uri='mongodb://127.0.0.1:xxxx/chatbot')# 打开并读取 TXT 文件内容
with open('corpus_cut.txt', 'r', encoding='utf-8') as file:conversation = file.readlines()# 创建训练器实例并迭代训练
trainer = ListTrainer(chatbot)
trainer.train(conversation)

ChatterBot 提供了多种存储适配器(Storage Adapter),可以将训练好的模型数据保存到不同的存储介质中,如文本文件、SQLite 数据库、MongoDB 数据库、Redis 队列等。其中,最常用的存储适配器是 JSON 文件和 SQLite 数据库。

如果你使用 SQLite 存储适配器,那么训练好的模型数据就会被保存在 SQLite 数据库文件中;如果你使用 JSON 存储适配器,那么训练好的模型数据就会被保存在 JSON 文件中。在每次启动机器人时,ChatterBot 会自动从指定的存储介质中加载模型数据。

4)通过命令行进行测试

注意要把输入的问句进行分词,然后丢给模型去匹配才能更精准

# -*- coding: utf-8 -*-
from chatterbot import ChatBot
import chatterbot.comparisons as comparisons
import chatterbot.response_selection as response_selectionimport jieba
import time
import colorama
from colorama import Fore,Style
import logginglogging.basicConfig(level=logging.INFO)colorama.init()  # 初始化 colorama,必须先执行chatbot = ChatBot("Ron", logic_adapters=[{'import_path': 'chatterbot.logic.BestMatch',"statement_comparison_function": comparisons.LevenshteinDistance,"response_selection_method": response_selection.get_first_response,'default_response': '无法识别您的问题,可以联系人工客服,请输入"人工客服"四个字','maximum_similarity_threshold': 0.9},{'import_path': 'chatterbot.logic.SpecificResponseAdapter','input_text': '人工客服','output_text': '您好,正在转接人工客服,请稍后。'},{'import_path': 'chatterbot.logic.SpecificResponseAdapter','input_text': '你好','output_text': '你好,我是智能问答机器人,能问有什么可以帮到你?'}],storage_adapter='chatterbot.storage.MongoDatabaseAdapter',database_uri='mongodb://127.0.0.1:27017/chatbot',
)# 轮询对话
while True:try:# 等待用户输入user_input = input('>>> ')if user_input:if user_input != '人工客服':# 获取 chatbot 响应word_list = jieba.cut(user_input)  # 进行分词result = " ".join(word_list)  # 将分词结果合并为字符串,以空格隔开else:result = user_inputbot_response = chatbot.get_response(result)score = bot_response.confidenceresp = bot_response.textresp = resp.replace(" ", "")print(Style.BRIGHT + Fore.BLUE + "Robot " + "("+str(score)+ ") : "+ Fore.RESET+ Style.RESET_ALL)for i in range(len(resp)):print(Fore.YELLOW + resp[:i+1]+ Fore.RESET, end='\r')time.sleep(0.1)print()  # 输出换行符以保证控制台输出完整except (KeyboardInterrupt, EOFError, SystemExit):break

5) 启动mongoDB并查看相关的数据

use chatbot
show collections
db.statements.find()

Chatterbot 打造游戏AI客服机器人相关推荐

  1. 网页客服机器人_易聊AI客服机器人强大线索获取能力助力企业稳操胜券

    移动互联网时代,各类的APP.网站等线上平台是诸多企业获取客户的重要来源,为了更好地收集潜在客户线索,为数众多的企业都采用了AI客服机器人.来自市场的数据显示,尽管这类机器人系统数量庞大,但是他们在获 ...

  2. AI开发者大会之语音语义技术实践与应用:2020年7月3日《NLP在教育行业的应用》、《AI防疫-语音语义技术在政务联络场景中的应用》、《智能客服机器人在售前导购场景中的应用实践》

    AI开发者大会之语音语义技术实践与应用:2020年7月3日<NLP在教育行业的应用>.<AI防疫-语音语义技术在政务联络场景中的应用>.<智能客服机器人在售前导购场景中的 ...

  3. AI智能语音客服机器人方案介绍/优点/核心

    介绍 智能语音电话系统,在语音电话交流中自动理解客户意向,并做出最恰当的回应,智能代替人工的基本原理如下:即在呼入/呼出过程中,利用ASR+NLP技术引导用户说出需求,通过真人录制的声音模仿与客户进行 ...

  4. AI智能电话客服机器人的交互流程

    就目前来说语音对话形式的智能客服机器人已经越来越多.人们想要处理什么事情,电话打到客服中心大多数的第一站是智能客服机器人,实在复杂的才有可能会交给人工客服处理.那么你知道智能电话客服机器人是怎么交互的 ...

  5. AI智能语音客服机器人功能介绍

    AI智能语音客服机器人的出现是这一时代发展的必然趋势.企业选择的AI智能语音客服机器人与人工坐席电话销售人员相比,节省了50%以上的成本,其工作效率可达到人工坐席电话销售的4~5倍.提高了通信效率和质 ...

  6. 环信与微博达成合作,打造多渠道智能客服体验

    近日,新浪微博宣布和环信正式达成合作协议,环信客服产品作为唯一合作伙伴,将为微博数百万认证帐号提供以移动端为核心的全媒体智能SaaS客服产品,帮助其提高客服效率和多端客服接入的用户体验.相比传统客服软 ...

  7. 智能客服机器人的场景应用及功能有哪些

    对于客服机器人来说,它是将单一.重复.常见的问题,通过知识库.意图识别.多轮对话等AI技术,替代人工解决大部分咨询问题,实现自助服务,帮助企业升级客服体验,提高服务效率,降低人力成本. 智能客服机器人 ...

  8. RPA智能客服机器人,电商的好伙伴

    智能客服是在大规模知识处理基础上发展起来的一项面向行业应用的,它是(大规模知识处理技术.自然语言理解技术.知识管理技术.自动问答系统.推理技术等等),具有行业通用性,不仅为企业提供了细粒度知识管理技术 ...

  9. 智能客服机器人的优势,促进客户服务自动化

    近年来人工智能已渗入工作生活中,由于AI智能技术越来越成熟,智能客服机器人已经成为客服系统发展的一种趋势,客服智能化也已经超过机器人自动回复的范畴,渗透于整个客服工作中.使客户能够更加便捷高效地进行自 ...

最新文章

  1. ElementUI中el-select请求springboot后台数据显示下拉项并在el-table中格式化显示
  2. vue 页面闪烁的问题_vue页面加载闪烁问题的解决方法
  3. 具有N个量子存储位的计算机,未来世界是科技的世界,未来的计算机也会有这几类...
  4. 微软推出 VS Code 新特性,为 TypeScript 和 JavaScript 用户提供 AI 辅助开发功能
  5. 如何使用CSS3 Border Radius属性
  6. Knockout.js 初探
  7. BoxFilter包滤波器
  8. [转] 面向对象编程 - 继承和多态
  9. 最新语言表示方法XLNet
  10. vue-自定义组件传
  11. c语言里变量要求,c语言中要求对变量作强制定义的主要理由是什么?
  12. python如何输出结果到txt_详解python读取和输出到txt
  13. Spring Cloud 入门到进阶 - 01 Eureka 服务实例的健康自检 (下)
  14. git clone出现 fatal: unable to access ‘https://github.com/...‘resolve host: ds-git.gree.com的解决办法
  15. 智能手表的机遇与挑战
  16. 如果时光可以倒流,会不会有不一样的故事
  17. 微信浏览器字体调整 PHP,如何针对微信浏览器的调整字体大小功能进行适配?...
  18. 软件:IIS上配置CGI
  19. barrier linux,Linux Barrier I/O
  20. 大数据量下,身份证的查询优化

热门文章

  1. 牛皮!这份GitHub上标星90.6K的Java面试指南+笔记,带你搞定96%的java面试
  2. 双指针算法(更新中....)
  3. Python3 tkinter 界面布局
  4. toolstrip 去掉圆角_c# – ToolStrip圆角
  5. Keil5修改背景黑色仿VS
  6. 雨心触动精灵VIP教程
  7. Leetcode-链表随机节点
  8. 小心!显卡BIOS刷新工具Nvflash变杀手
  9. 测试环境问题排查的那些事儿
  10. Resnet中文翻译