新技術讓大數據“看得見”
隨著全球社會活動日益呈現數字化,大數據的增長速度正在顯著加快。從電子郵件和協作,到社交媒體網站、圖片站點和視頻網站以及採購交易記錄等大量來源,每天生成的數據預計達到250萬億字節。這標志著數據和新的計算模型進入新的計算時代。 “這就需要採用新型數據分析技術,使企業不僅可以處理大量信息,幫助企業制定更好的業務決策。”IBM高級副總裁Steve Mills在近日舉辦的信息隨需應變大會上表示:“數據的價值在持續增長,對客戶的區分應該圍繞著預測展開,因為預測分析可以幫助業務快速有效地轉型。” 在大會上,IBM宣布推出三款全新的數據發現與可視化軟件,這些新軟件讓用戶無需專業技能便能夠用可視化方式與數據進行互動,並對其執行高級分析。分析技能差距使得日常商務用戶無法使用當前的數據發現工具,而新的軟件將有助於縮小這一差距。借助新的軟件,數據信息將可在幾分鐘內從原始信息出發,最終得到深藏於結構化與非結構化信息中的答案。 其中一軟件,可以幫助用戶與數據更好地互動。不具備專業技能或知識的商務用戶無需被迫學習分析技術,便可使軟件處理原始數據集合。該軟件採用簡單的界面、交互式可視化與高級分析,可自動使隱藏的洞察與模式浮出水面,並引導商務用戶找到深藏於數據中的答案,而且該軟件可托管在雲端之上。 舉一個應用的例子,當一位營銷經理發起簡單的提問,輸入相關數據,可視化與引導分析軟件就能夠發現是什麼原因導致某個季度銷售額下滑。營銷經理可以第一時間將發現的結果與其他員工分享,並通過向團隊成員發送輸入通道,讓團隊成員補充更多的信息。從而讓人力資源、營銷與銷售等部門的用戶可在其任何設備上利用分析圖在數量與種類不斷增加的數據中尋找答案。 會議期間,IBM院士、實體分析首席科學家Jeff Jonas在接受記者採訪時表示,速度是大數據分析非常關鍵的一個因素——例如,當用戶要基於數據分析的結果來決策股票交易行為時,如果分析報告需要1個小時之后才能拿到,這實際上就沒有太大意義了。 “我們非常看重分析的時效性,力圖縮短分析時間,提高時效性。IBM在這方面的典型技術就是流處理技術,能夠實時對數據進行處理。”Jeff透露,IBM有一項研究了5年,研發代號為G2的技術,反應速度可以達到200毫秒以內。 |
NLPIR 2014大会:汉语分词系统NLPIR 2014发布暨ICTCLAS用户交流大会
汉语分词系统NLPIR(前身ICTCLAS)从2000年诞生以来,历时14年,全球用户突破30万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名,已经成为中文信息处理领域标杆性的工作。ICTCLAS创始人张华平博士倾力打造,即将推出的NLPIR2014版,是迄今为止最大的一次更新,在汉语分词体系架构下增加了对英文词法分析的支持,可以自动识别英文词汇的原型、词性标注、命名实体与关键词;并在当前汉语词法分析的基础上,实现了文档的完整语义分析,自动提取文档的人名、地名、机构名、文章作者、发布的媒体、关键词与摘要,是当前中文信息处理的必备神器,值得期待!
我们即将召开NLPIR2014发布暨ICTCLAS用户大会,由北京理工大学大数据搜索挖掘实验室主办,计算机世界与大数据论坛联合承办。张华平博士诚邀历年来所有支持我们前行的ICTCLAS用户,中文分词及中文信息处理的技术爱好者莅临参加,分享中文语言智能理解的美妙。届时,张华平博士将亲自讲解NLPIR2014背后的技术原理与最新进展,并由资深工程师在不同操作系统不同开发语言下NLPIR的实训技巧,同时还有不同背景的资深用户分享他们的使用开发经验。
在线报名:http://118.192.14.52/bigdatatrain/bm.jsp(请注明NLPIR2014;场地有限,只接收前100名)
基本信息
会议形式 |
(a) PPT算法讲解; (b) NLPIR2014系统演示与实际开发操作; (c) 针对学员具体需求的互动交流会 (d) 提供专属U盘:保护NLPIR2014的演示系统、各类试用的API以及新版开发手册; |
会议时间 |
12月21日上午9:00-12:00,下午13:30-17:00 ( 17:00-18:00 开放式讨论答疑 ) |
门票费用 |
(a)1400元 (包含门票,NLPIR2014演示系统、开发包与文档, U盘,工作餐,赠送由张华平博士亲笔签名的《大数据搜索与挖掘》专著); (b) 12月10日前缴费优惠价1300元;老学员或同单位三人以上报名九折优惠;全日制学生凭学生证会费优惠价格980元,不含发票。 (c)名额有限,参会者需在参会前提前购买门票。 (d)差旅及食宿费用自理。 |
与会嘉宾 |
主讲人:张华平:NLPIR(ICTCLAS)创始人与开发者,北京理工大学大数据搜索挖掘实验室主任,博士,副教授 主持人:赵燕平:北理工经管学院教授,北京理工大学大数据搜索挖掘实验室副主任 特邀ICTCLAS典型用户嘉宾待定(将包括跨国企业、金融、政府机关、科研院所、投资与互联网等代表性用户) |
会议地址 |
北京理工大学理工国际交流中心 |
在线报名:http://118.192.14.52/bigdatatrain/bm.jsp(请注明NLPIR2014;场地有限,只接收前100名)
ICTCLAS创始人张华平博士简介
2005年博士毕业于中科院计算所,研究方向为:微博计算、自然语言处理、信息检索与信息安全、大数据搜索与挖掘。曾先后获得2010年度钱伟长中文信息处理科学技术奖一等奖,中科院院长优秀奖、中科院计算所所长特别奖,中科院计算所“百星计划”首批入选者。张华平作为课题组长主持开发了国家自然科学基金、863、973、242等科研课题十余项,发表《大数据搜索与挖掘》《信息检索:算法与启发式规则》《自然语言理解》等专译著3部,所研制的ICTCLAS分词系统已经向国内外的企业和学术机构颁发了三十万多份授权,在学术界和产业界得到了广泛的应用。并作为特邀技术专家,先后在中央电视台、全国网络侠客行大会、全球大数据技术峰会、中国网络科学大会上做大数据相关的主题演讲,广受好评。
会议日程
时间 |
讲师 |
环节 |
主要内容 |
8:00-9:00 |
各位参会人员 |
会议报到 |
签到,领取各项资料。 |
9:00-9:20 |
赵燕平教授 |
大会开幕式 |
开幕式致辞,嘉宾与学员介绍 |
9:20-09:50 |
张华平博士 |
NLPIR2014发布 |
1) NLPIR2014功能展示:分词、词性标注、命名实体识别、新词识别、英文分析、关键词提取; 2) NLPIR2014开发包介绍 |
09:50-10:10 |
合影留念及茶歇 |
||
10:10-12:00 |
张华平博士 |
NLPIR2014汉语分词关键技术及最新进展 |
1. ICTCLAS的层叠隐马分词模型(汉语分词、未登录词识别、词性标注) 2. ICTCLAS的词典管理专利算法:完美双数组TRIE树; 3. 新词识别与关键词提取算法原理; 4. NLPIR2014英语词法分析技术; |
12:00-13:30 |
工作午餐 |
||
13:30-15:00 |
张华平博士 康肖钰硕士生 张冰波硕士生 |
NLPIR2014汉语分词开发包使用实训 |
1. NLPIR2014 C/C++语言调用实训 2. NLPIR2014 Java语言调用实训 3. NLPIR2014 Linux调用实训 4. NLPIR2014 高级编程实训(多线程安全、用户自适应分词、python调用、关键词提取等) |
15:00-15:30 |
朱勇高级工程师 |
NLPIR示范应用:黄金眼Web大数据搜索与挖掘平台 |
主要介绍利用NLPIR系统开发的黄金眼Web大数据搜索与挖掘平台,展示主要功能与背后的实战应用经验,目前已经应用于工信部、总参、财经杂志等单位。 |
15:30-16:00 |
姜伟(北京外事办信息中心主任) |
NLPIR示范应用:政务公文主题词提取系统 |
主要介绍利用NLPIR系统开发的政务公文主题词系统,历经十余年,目前已经应用于大部分政府机关。 |
16:00-16:30 |
罗文川(缔元信CTO) |
NLPIR示范应用:缔元信网站统计数据挖掘与应用 |
主要介绍缔元信利用NLPIR系统开发的互联网网站统计数据挖掘与应用,是目前网站统计方面权威的机构。 |
16:30-17:00 |
待定 |
||
17:00-18:00 |
张华平博士 |
交流沙龙 |
可与ICTCLAS创始人张华平博士直接交流讨论 |
名额有限,先到先得,参会报名热线:
张老师 :13681251543 Email: zhangjie@bigdatabbs.com
官网支持:http://ictclas.nlpir.org
在线报名:http://118.192.14.52/bigdatatrain/bm.jsp(请注明NLPIR2014;场地有限,只接收前100名)
转载于:https://my.oschina.net/u/1160813/blog/180792
新技術讓大數據“看得見”相关推荐
- 交易服務助力大數據產業生態系統完善
據有關預測,未來三年內,我國大數據市場將以每年超過60%的速度增長,預計到2017年市場規模將達到37.9億美元.面對爆炸式增長的市場,面對不遠處誘人的"大蛋糕",我國大數據產業生 ...
- airflow 進行後端大數據中ETL處理(草稿)
情境說明: 公司接了外部的數據源,要把資料同步到gcp雲端來,資料表很多 ,我們使用了多種方式把資料寫入到我們公司位於gcp上的bigquery 資料表 問題 資料表很多樣,不同的資料表有不同的ETL ...
- java bigdecimal.valueof_java 中的大數據類型(BigInteger和BigDecimal) | 學步園
一.為什麼為用到BigInteger和BigDecimal這種數據類型呢? 我們非常清楚,java裡面整型int與浮點型float,double它們存放數據的範圍是有邊界的.那麼如果需要更大的數據時, ...
- 大數據分析Excel Power BI全方位應用彩色版
大數據分析Excel Power BI全方位應用彩色版: https://72k.us/file/15622618-399493211 有因时之事二:一曰分旗移屯.京旗.驻防旗人生计困顿,值 此兵事之 ...
- 大數據:到2020年您應該知道的70個令人難以置信的免費數據源
70個令人難以置信的免費數據源 所有出色的数据可视化都始于需要大量优质可靠的数据.大多数人认为收集大数据将是一项艰巨的工作,但事实并非如此.在线网站上有数千个免费数据集,任何人都可以随时对其进行分析和 ...
- [大數據、Big Data、巨量資料、海量資料]之分析模式工具
[大数据.Big Data.巨量数据.海量数据]之分析模式工具 相关资料 : http://www.wisdom1.net/?cat=9 Data link Visualization Maker ...
- 大數據環境搭建,數據採集,數倉環境準備(hive on spark) 01
服務器搭建 更改時區,改爲cst [sarah@hadoop104 ha]$ sudo vi /etc/sysconfig/clock zone = Asia/Shshanghai [sarah@ha ...
- FMDB與SQLite 數據庫應用示範:打做一隻簡單的電影資料庫 App
原文:http://www.appcoda.com/fmdb-sqlite-database/ 作者:GABRIEL THEODOROPOULOS 譯者:kmyhy 通常在 App 中使用數據庫并處理 ...
- 技術的變與不變之間...Silverlight 3.0的驚鴻一撇
今天在公司開會的時候,一位作者好友透過MSN通知我Scott的BLOG上果然開始出現了Silverlight 3的消息,我一聽不得了,第一時間看了Scott的BLOG,大意是說,Silverlight ...
最新文章
- 在线答题系统开发经验mysql,php
- numpy生成随机数
- 有哪些优化技巧更利于手机端网站排名提升?
- centos6 安装 mantisbt-1.2.8 —— (4)在CentOS6.4中安装配置LAMP环境
- VMware Identity Manager 与CAS, Keycloak的集成
- BZOJ 1683.City skyline 城市地平线
- 互联网晚报 | 1月25日 星期二 | 知乎首次举办上星晚会;微信视频号上线首个付费直播间;淘宝天猫“春节不打烊”活动正式上线...
- 在命令行中将CentOS 7与Samba4 AD集成
- python静态方法怎么调用_在python中调用静态方法
- 【飞控理论】【惯性导航基础】什么是欧拉角?为什么会有欧拉角?欧拉角在航空领域的运用?
- python中collections模块_Python的collections模块
- 美丽的回测 —— 教你定量计算过拟合概率
- matplotlib 绘制直方图和拟合正态曲线
- PS抠图工具Topaz ReMask中文汉化(win/mac版,含教程)
- 将linux系统制作成iso镜像文件
- 如何使用Everything搜索局域网共享文件夹?
- MICHAEL KORS推出全新标志性智能腕表:Runway系列智能腕表
- Android10的GPU呈现模式分析在哪?
- 理解QPS、TPS、RT、吞吐量
- 解析北斗/GNSS高精度数据处理暨GAMIT/GLOBK v10.75软件
热门文章
- equestresponseservletContext
- python二级证书考试难度_全国计算机等级考试 python二级考试体验及小技巧总结...
- Xilinx Zynq开发教程
- word文档的只有横线的表格怎样做
- Git分布式版本控制工具【IDEA版】【安装和使用以及上传代码到Gitee】(一篇文章精通系列)
- 程序员转行能做什么?
- python --- comment
- C++ 多态(二) : 虚函数、静态绑定、动态绑定、单/多继承下的虚函数表
- 【简易搭建个人博客】------- 基于BT面板的个人博客搭建
- 如何在安装了VS2010的情况下安装SQL Server 2008