毕设做的是文本纠错方面,然后今天进组见研究生导师 。老师对我做的东西蛮感兴趣。然后介绍自己现在做的一些项目,其中有个模块需要有用到文本纠错功能。

要求1:有多人同时在线编辑文档,然后文档功能有类似Word中的在疑似错误下标浪线,或者标记高亮,并且要推荐修改选项

要求2:语料数据的获取、处理以及完善

要求3:文章写完后要有生成keyword

根据老师所讲要查阅文献,以及已有项目来分析可行性,首先想到之前曾有同学调用百度API来进行文档的纠错,然后在这里试了一下。

API描述

识别输入文本中有错误的片段,提示错误并给出正确的文本结果。支持短文本、长文本、语音等内容的错误识别,纠错是搜索引擎、语音识别、内容审查等功能更好运行的基础模块之一。

Step 1  获取assess_token

根据百度开发手册 ,我们需要进行获取assess_token(用户身份验证和授权的凭证)

详细请见百度开发手册

因为百度所给的实例中是python2    然后我用的是python3  会有一些变化  这里只贴python3代码供自己回忆参考

importurllib.requestimporturllib,sysimportssl#client_id 为官网获取的AK, client_secret 为官网获取的SK

host = 'https://aip.baidubce.com/oauth/2.0/token?'\'grant_type=client_credentials&client_id=**********&client_secret=**************'request=urllib.request.Request(host)

request.add_header('Content-Type', 'application/json; charset=UTF-8')

response=urllib.request.urlopen(request)

content=response.read()if(content):print(content)

执行代码后  可在控制台中看到所要的token_key

另附实例

#-*- coding: utf-8 -*-

importurllibimportjson#client_id 为官网获取的AK, client_secret 为官网获取的SK

client_id =【百度云应用的AK】

client_secret=【百度云应用的SK】#获取token

defget_token():

host= 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + client_id + '&client_secret=' +client_secret

request=urllib.request.Request(host)

request.add_header('Content-Type', 'application/json; charset=UTF-8')

response=urllib.request.urlopen(request)

token_content=response.read()iftoken_content:

token_info=json.loads(token_content)

token_key= token_info['access_token']return token_key

Step 2 文本纠错应用部分

POST方式调用

注意:要求使用JSON格式的结构体来描述一个请求的具体内容。

body整体文本内容可以支持GBK和UTF-8两种格式的编码。

URL参数:参数 值

access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取”

Header如下:参数 值

Content-Type application/json

返回说明

#-*- coding: utf-8 -*-#!/usr/bin/env python

importurllibimportjson#Access Token的有效期为30天(以秒为单位),请您集成时注意在程序中定期请求新的token

#client_id 为官网获取的AK, client_secret 为官网获取的SK

client_id='***********'client_secret='*************'

#获取token

defget_token():

host= 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + client_id + '&client_secret=' +client_secret

request=urllib.request.Request(host)

request.add_header('Content-Type', 'application/json; charset=UTF-8')

response=urllib.request.urlopen(request)

token_content=response.read()iftoken_content:

token_info=json.loads(token_content)

token_key= token_info['access_token']returntoken_keydeftxt_correction(content):print('原文:', content)

token=get_token()

url= 'https://aip.baidubce.com/rpc/2.0/nlp/v1/ecnet'params=dict()

params['text'] =content

params= json.dumps(params).encode('utf-8')

access_token=token

url= url + "?access_token=" +access_token

request= urllib.request.Request(url=url, data=params)

request.add_header('Content-Type', 'application/json')

response=urllib.request.urlopen(request)

content=response.read()ifcontent:

content= content.decode('GB2312')

data=json.loads(content)

item= data['item']print('纠错后:', item['correct_query'])print('Score:', item['score'])

txt_correction('汽车形式在这条道路上')

运行结果如下:

>> 原文:汽车形式在这条道路上>> 纠错后:汽车行驶在这条公路上>> Score:0.982835

java实现文本纠错功能_调用百度API进行文本纠错相关推荐

  1. SpringBoot项目调用百度API 实现文本与图像审核功能

    SpringBoot项目调用百度API 实现文本与图像审核功能 最近在开发一款微信小程序,其中具有发布帖子的功能,因此需要审核发布的文本与图像(不然开发的微信小程序过不了审).本来是调用微信小程序的A ...

  2. 调用百度API 对文本进行情感倾向分析(舆情分析)

    @[TOC] # 1.准备工作 1.注册百度账号,登录百度智能云,点击总览选择自然语言处理,创建应用(创建选项认真阅读,填写) 创建好应用会生成相应的AppID API Key  Secret Key ...

  3. Java调用百度API实现文本与图像审核功能

    文档: API文档:https://ai.baidu.com/ai-doc/ANTIPORN/ek3h6x90n SDK下载:https://ai.baidu.com/sdk#anti github链 ...

  4. java 生成短链接_java调用百度API生成短链接(一)

    短链接,顾名思义,用一个短的链接代替长而繁琐的真实链接 import net.sf.json.JSONObject; import org.apache.http.impl.client.Defaul ...

  5. java调用百度翻译_Java调用百度API实现翻译-Go语言中文社区

    下面是Java调用百度API实现翻译的具体步骤: 一.在写代码之前先在在百度翻译平台中,申请APP_ID 申请地址申请的详见点击打开链接 申请之后,会得到APP_ID和SECURITY_KEY 二.j ...

  6. Java调用百度API实现图像识别

    Java调用百度API实现图像识别 最近在做一个关于识别的小功能,翻阅了一堆资料,也实践自己去实现这个功能,最后识别的结果不是那么理想.这里介绍一个完全可以商用以及识别率超高的百度ai接口 1.为什么 ...

  7. Java调用百度API生成短网址

    由于百度短网址旧API更新,故更新下原博客内容(仅供参考),希望小伙伴们以官方API为主,以防影响使用. 官方API:https://dwz.cn/console/apidoc package com ...

  8. Java调用百度API出现{status:211,message:APP SN校验失败}

    Java调用百度API出现{"status":211,"message":"APP SN校验失败"} {"status" ...

  9. 百度翻译api设置 java_Java调用百度API实现翻译

    下面是Java调用百度API实现翻译的具体步骤: 一.在写代码之前先在在百度翻译平台中,申请APP_ID 申请地址申请的详见点击打开链接 申请之后,会得到APP_ID和SECURITY_KEY 二.j ...

最新文章

  1. LeetCode简单题之交替合并字符串
  2. freeBSD时区设置与时间设置
  3. JZOJ 3769. 【NOI2015模拟8.14】A+B
  4. 阿里公共DNS正式发布:223.5.5.5 223.6.6.6
  5. pandas新建dataframe_pandas数据处理
  6. 杭州高职单招计算机试题,河北省高职单招职业技能练习题20
  7. nssl1453-Fibonacci数列【矩阵乘法,线段树】
  8. Net基础篇_学习笔记_第十二天_面向对象继承(字符串_字符串的不可变性)
  9. windows :32位到64 位
  10. android圆图,Android实现圆形图片或者圆角图片
  11. tdav_converter_video.cxx:49:9: error: ‘uint8’ does not name a type; did you mean ‘uint’?
  12. Qt配置OpenCV教程,亲测已试过(详细版)
  13. 用Radeon RAMDisk在Windows 10中创建关机或重启不消失的内存虚拟盘
  14. mysql preparedstatement 批量update_Statement和PreparedStatement批量更新
  15. 计算机桌面图标右上角出现双箭头符号,电脑桌面图标有箭头,如何消除小小障碍小编有绝招...
  16. 由JavaScript版迷宫游戏引出Java版迷宫地图生成器
  17. 微信小程序实现类似微信评论区回复组件(mpx)
  18. Android 播放器之流媒体,边下边播如此简单。
  19. 量化交易 实战第一课 策略入门
  20. d3d12.dll丢失怎么修复-d3d12.dll修复工具下载

热门文章

  1. 积分球式光源色温校准
  2. Java的Lambda表达式实例
  3. 使用Domain Adaption提升小场景时间序列预测效果的方法
  4. 7-4 最短路径之Dijkstra(朴素dijkstra打印路径)
  5. python爬取高德地图_爬虫实战:如何爬取高德地图?
  6. vue如何实现打印功能
  7. hive 以beeline的模式启动
  8. kbd通达2017版破解后,自定义菜单无法调用表单开启流程/kbdkbd 错误,请联系管理员 /general/approve_center/new/insert.php/kbd
  9. winSCP:无权访问。 错误码:3 服务器返回的错误消息:Permission denied解决方案
  10. 手机ppi排行测试软件,2018主流厂商旗舰手机屏幕测试数据汇总和子项排名统计...