ai模型

We at Zetane are all about democratizing AI, but getting to the laudable goal of empowering more people within AI innovation requires many steps along the way. One beginner’s step on our journey involves peeling away the abstract nature of AI like the skins of an onion. We peel these layers of abstraction away by presenting fundamental components of machine learning in ways technical and non-technical professionals can appreciate. This will be a repeated theme of ours on the Zetane blog, which we call:

我们在Zetane都是关于民主化AI,但得到授权向AI创新中更多的人值得称道的目标要求沿途许多步骤。 初学者迈出的第一步包括剥开AI的抽象本质,例如洋葱皮。 通过以技术人员和非技术人员可以欣赏的方式展示机器学习的基本组成部分,我们将这些抽象层剥离掉了。 这将是Zetane博客上我们主题的重复主题,我们称之为:

This is what AI looks like.

这就是AI的样子。

To start us off we present here the Bidirectional Attention Flow model, or BiDAF.

首先,我们在这里介绍双向注意力流模型或BiDAF

At first glance, this model looks to be a practical attempt to understand elements of unstructured text. Its development in 2016 marked a major step forward in Natural Language Processing (NLP) for Question and Answer tasks. That may at first sound straightforward. This basic task, however, has huge implications in business as a tool to automate important tasks like customer support inquiries or common requests for information. It thus comes as no surprise that this model attracts fervent investment and research. Aside from the model’s commercial applications, BiDAF marks an important milestone in opening the doors to a not-too-distant future of appreciable Machine Comprehension. Building on knowledge gained from BiDAF, the machine learning community has since brought forth the superior NLP models of BERT and ELMo.

乍一看,该模型似乎是理解非结构化文本元素的实际尝试。 它在2016年的发展标志着自然语言处理(NLP)在问答任务方面迈出了重要的一步。 乍一看听起来很简单。 但是,此基本任务作为使重要任务(例如客户支持查询或常见的信息请求)自动化的工具在业务中具有重大意义。 因此,这种模式吸引了无数的投资和研究也就不足为奇了。 除了该模型的商业应用之外,BiDAF还标志着一个重要的里程碑,它为不久的将来可观的机器理解打开了大门。 机器学习社区以从BiDAF获得的知识为基础,提出了BERT和ELMo的高级NLP模型。

For the time being, let’s take a closer look at BiDAF and some of its complexities, beginning with an image of the full neural network.

目前,让我们从完整的神经网络的图像开始,仔细研究BiDAF及其一些复杂性。

A display of the BiDAF model in Zetane zoomed out to show the extent of the full neural network. It is complex!
Zetane中BiDAF模型的显示被缩小以显示整个神经网络的范围。 这很复杂!

The dimensions of the BiDAF model should grab one’s attention. When viewing the model end-to-end, it is difficult to make out the appreciable complexity of the neural network. Let’s zoom in for a closer look, focusing on the left-side input layers of the network.

BiDAF模型的尺寸应引起人们的注意。 端到端查看模型时,很难确定神经网络的明显复杂性。 让我们放大一下以集中查看网络的左侧输入层。

SQuAD. The mid-green squares on the far left and far right represent four distinct input layers.的阵容 。 最左侧和最右侧的中间绿色方块代表四个不同的输入层。

The above image shows a typical ‘source’, being text with a jumble of information. Upon querying the basic question ‘What color is the fox?’, the model predicts the best answer is ‘brown’, being spot-on. Of particular interest here are the four input layers of the neural network, represented by the mid-green squares. Machine-learning models often have one input, but the specifics of the question-and-answer task requires a bit more work in terms of structuring and analysing the data as text. Let’s inspect further to better understand why that is the case.

上图显示了一个典型的“来源”,即带有混杂信息的文本。 在询问基本问题“狐狸是什么颜色?”时,该模型预测最佳答案是“棕色”,即亮点。 这里特别有趣的是神经网络的四个输入层,由中间的绿色方块表示。 机器学习模型通常只有一个输入,但是问答结构的细节在以文本形式构造和分析数据方面需要更多的工作。 让我们进一步检查以更好地理解为什么会这样。

Left: the first two input layers of BiDAF. Right: the latter two input layers of BiDAF
左:BiDAF的前两个输入层。 右:BiDAF的后两个输入层

The first input layers are the context_char and query_char, being abbreviations for the inputs of character-level representations of the text and the question (“query”). The latter two inputs of contex_word and query_word are where word-level representations of the text and question become incorporated in the analysis by the neural network. This architecture shows there is an initial processing of the text and then a subsequent assessment of the words in order to achieve an appreciable level of language comprehension. Overall, the BiDAF model aims to identify a context and then keywords integral to the context, where the layered design of the neural network makes it easier for the model to tease out the answer keyword from the general context. It’s interesting to note that the model does this by converting all text into math, namely vectors, meaning its ability to understand text has little to do with text per se and is in fact a probability-based prediction of pairing words.

第一个输入层是context_char和query_char,它们是文本和问题(“查询”)的字符级表示的输入的缩写。 contex_word和query_word的后两个输入是文本和问题的单词级表示形式在神经网络分析中的合并位置。 此体系结构显示了对文本的初始处理,然后对单词进行了后续评估,以实现可理解的语言理解水平。 总体而言,BiDAF模型旨在识别上下文,然后识别上下文中不可或缺的关键字,其中神经网络的分层设计使该模型更容易从通用上下文中挑出答案关键字。 有趣的是,该模型通过将所有文本转换为数学(即向量)来实现此目的,这意味着其理解文本的能力与文本本身无关,实际上是基于概率的配对词预测。

To conclude our overview of BiDAF we present a short video capture of the model in our environment for machine learning projects. Here is a display of the breakdown and analysis of the vectorized text information as it passes through nodes of the neural network. We intermittently show the internal metrics of the information at the nodes, called tensors. The take-home message here is that whether data is in the form of text, images, video or whatnot, a neural network transforms that information into a universal language of advanced — and arguably aesthetic — statistics.

总结我们对BiDAF的概述,我们将在我们的环境中为机器学习项目展示该模型的简短视频。 这是矢量化文本信息通过神经网络节点时的细目分类和分析的显示。 我们间歇地显示节点上信息的内部度量,称为张量。 这里要传达的信息是,无论数据是文本,图像,视频还是其他形式,神经网络都会将该信息转换为高级的统计数据(可以说是美学)。

This is what AI looks like.

这就是AI的样子。

You can read more about the foundational research for BiDAF right below (or follow links to the .pdf articles here & here).

您可以在下面阅读有关BiDAF基础研究的更多信息(或在此处和此处,链接到.pdf文章)。

补充阅读 (Additional reading)

We appreciate this article by Meraldo Antonio that also provides a visual representation of the BiDAF model.

我们赞赏Meraldo Antonio的这篇文章,该文章还提供了BiDAF模型的直观表示。

致谢 (Acknowledgement)

We thank Semih Cantürk for providing the images and video for this post.

我们感谢SemihCantürk为这篇文章提供的图像和视频。

翻译自: https://medium.com/zetane-blog/this-is-what-ai-looks-like-bidaf-model-for-question-answering-8a0a69bcb045

ai模型


http://www.taodudu.cc/news/show-863804.html

相关文章:

  • 正则化技术
  • 检测对抗样本_避免使用对抗性T恤进行检测
  • 大数据数据量估算_如何估算数据科学项目的数据收集成本
  • 为什么和平精英无响应_什么和为什么
  • 1. face_generate.py
  • cnn卷积神经网络应用_卷积神经网络(CNN):应用的核心概念
  • 使用mnist数据集_使用MNIST数据集上的t分布随机邻居嵌入(t-SNE)进行降维
  • python模型部署方法_终极开箱即用的自动化Python模型选择方法
  • 总体方差的充分统计量_R方是否衡量预测能力或统计充分性?
  • 多尺度视网膜图像增强_视网膜图像怪异的预测
  • 多元线性回归中多重共线性_多重共线性如何在线性回归中成为问题。
  • opencv 创建图像_非艺术家的图像创建(OpenCV项目演练)
  • 使用TensorFlow进行深度学习-第2部分
  • 基于bert的语义匹配_构建基于BERT的语义搜索系统…针对“星际迷航”
  • 一个数据包的旅程_如何学习数据科学并开始您的惊人旅程
  • jupyter 托管_如何在本地托管的Jupyter Notebook上进行协作
  • fitbit手表中文说明书_如何获取和分析Fitbit睡眠分数
  • 熔池 沉积_用于3D打印的AI(第2部分):异常熔池检测的一课学习
  • 机器学习 可视化_机器学习-可视化
  • 学习javascript_使用5行JavaScript进行机器学习
  • 强化学习-动态规划_强化学习-第4部分
  • 神经网络优化器的选择_神经网络:优化器选择的重要性
  • 客户细分_客户细分:K-Means聚类和A / B测试
  • 菜品三级分类_分类器的惊人替代品
  • 开关变压器绕制教程_教程:如何将变压器权重和令牌化器从AllenNLP上传到HuggingFace
  • 一般线性模型和混合线性模型_线性混合模型如何工作
  • 为什么基于数字的技术公司进行机器人研究
  • 人类视觉系统_对人类视觉系统的对抗攻击
  • 在神经网络中使用辍学:不是一个神奇的子弹
  • 线程监视器模型_为什么模型验证如此重要,它与模型监视有何不同

ai模型_这就是AI的样子:用于回答问题的BiDAF模型相关推荐

  1. reactor线程模型_面试一文搞定JAVA的网络IO模型

    1,最原始的BIO模型 该模型的整体思路是有一个独立的Acceptor线程负责监听客户端的链接,它接收到客户端链接请求之后为每个客户端创建一个新的线程进行链路处理,处理完成之后,通过输出流返回应答给客 ...

  2. 照片转3d模型_这个AI能帮你女朋友自拍:从照片生成3D视频,总有个角度让她满意...

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 爱自拍的女生,为了拍一张美照总是需要很久,就是为了找到最美的角度. 比如这位妹子,在自己的书架前拍了4张自拍照,都不太满意. 现在可以把选 ...

  3. 照片转3d模型_这个AI能帮女朋友自拍:照片生成3D视频,总有个角度让她满意

    晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI 爱自拍的女生,为了拍一张美照总是需要很久,就是为了找到最美的角度. 比如这位妹子,在自己的书架前拍了4张自拍照,都不太满意. 现在可以把选最 ...

  4. 机器学习ai选股_机器学习技术能够有效用于选股吗?(下)

    未经授权,严禁转载 前言 在本篇论文的前半部分,作者提供了一些关于机器学习的基本概念,并指出机器学习在处理金融数据时很容易遭受过拟合的问题.作者对此提出了几种解决方法,包括结合不同的算法和信号窗口.此 ...

  5. 国际象棋ai下载_国际象棋AI的解剖

    国际象棋ai下载 Chess-playing programs made their grand debut in the 50's. They were unsurprisingly fairly ...

  6. ai人工智能_当AI接手我们的三种情况时

    ai人工智能 不像Luddites (Unlike the Luddites) In the 19th century, a group of textile workers, know as the ...

  7. python api调用百度ai平台_百度ai开放平台使用方法(附带详细案例步骤)

    百度ai开放平台 1.百度ai开放平台内有众多功能,如文字识别,语音技术等等内容,本文章以身份证识别为例子,教大家怎么使用它啦 链接走起:https://cloud.baidu.com/?from=c ...

  8. 用python实现ai围棋_围棋AI.Leela+Python脚本分析棋谱

    完成了Sabaki+LeelaSabaki+Leela GTP搭建完美围棋AI平台后,在"飞扬围棋论坛"看到有棋友介绍用Leela+Python脚本分析棋谱,于是也试了一下. 软件 ...

  9. java ai库_百度AI开放平台 Java SDK

    安装Java SDK Java SDK主要目录结构 com.baidu.aip ├── auth //签名相关类 ├── http //Http通信相关类 ├── client //公用类 ├── e ...

最新文章

  1. jstatd,VisualVM使用和报错解决:Could not create remote object--java.security.AccessControlException
  2. 3星|《终身成长》:成长型思维让人进步,固定型思维让人固步自封。有新意的励志书,但有锤子模式的嫌疑。...
  3. 第一次Sprint总结
  4. android 侧滑删除功能,200行代码让你在Android中完美实现iOS版侧滑删除效果
  5. MSPA安装与生态源地提取
  6. LINUX操作系统的内核编译内幕详解一
  7. celery 实例进阶
  8. android 沉浸式_【沉浸式体验】投影秀科技与视觉:体验亦真亦幻的超常感受
  9. nodejs gm 中文 linux,nodejs gm drawText使用(中文、字体、大小及颜色)
  10. 云计算与大数据技术应用2020.10.21
  11. Vue.js Ajax(axios)
  12. Tensorflow2.6.0-MKL for C++
  13. 计算机组成原理---第二章运算器和运算方法
  14. 数据仓库之数据质量监控
  15. ui(new Ui::MainWindow) 解惑
  16. AAAI 2021-TextGAIL:Generative Adversarial Imitation Learning for Text Generation
  17. 武汉理工计算机网络,计算机网络实验武汉理工大学
  18. 2008终端管理服务器授权已到期,Citrix ICA 客户端不会断开连接从 Windows Server 2008 终端服务器如期如果在宽限期已过期,终端许可证服务器未配置...
  19. [Excel图表]瀑布图的完美解决方案
  20. mysql offset用法

热门文章

  1. 方法重载,new,override
  2. 关于处理小数点位数的几个oracle函数
  3. HttpURLConnection和HttpClient的简单用法
  4. C#中使用资源文件保存图片和皮肤文件的使用
  5. http 使用curl发起https请求
  6. Python实现局域网(Socket)通信
  7. Farseer:一个用于Silverlight和XNA的开源物理引擎
  8. iis 跨域_织梦会员登录二级域名不能跨域
  9. ubuntu nginx安装
  10. linux文件本编辑,Linux就该这么学 -- 命令 -- 文本文件编辑命令