「万物皆可 embedding」

万物到底如何被 embedding?

Towhee 产研团队

期待与你携手

构建一套开源的「embedding 万物」系统!

01

我们是谁

Towhee 是一个开源的非结构化数据语义提取平台,支持单机及云环境部署。Towhee 致力于向用户、开发者、数据科学家们提供丰富的预训练模型、易用且强大的调用框架,以及一个活跃的技术社区。

Towhee 可以说是开源向量数据库 Milvus 的孪生项目。在研发 Milvus 的过程中,工程师们发现大量的用户小伙伴在「非结构化数据的语义理解」「向量化编码」两方面遇到了许多困难。目前,学术界和工业界在 embedding 领域积累了很多工作成果,但这些成果都散落在各式各样的论文和独立项目中。Towhee 项目的发起,正是希望围绕开源社区构建一套标准化的 embedding pipeline,并提供丰富的 embedding 算子,从而大幅度降低小伙伴们做 embedding 任务的门槛。

"X2Vec, Towhee is all you need!"是 Towhee 项目的口号,也是 Towhee 社区的长期目标。现在,Towhee 处在 v0.1 的阶段,初步构建起了 pipeline 框架。在系统框架层面、算法模型层面、社区建设层面,还有很多重要的工作要做,Towhee 产研团队期待和你一起,解决产业刚需、探索前沿科技!

02

在 Towhee 产研团队工作

是怎样的体验

人通,Zilliz 合伙人、研发总监,华中科技大学计算机软件与理论博士,CCF 分布式计算与系统专委会委员。主要工作领域为数据库、分布式系统、缓存系统、异构计算,相关研究成果在 SIGMOD、USENIX ATC、ICS、DATE、IEEE TPDS 等国际顶级会议与期刊上发表。目前致力于探索面向 AI 的大型数据库系统技术,是 Milvus 项目的系统架构师、Towhee 项目的负责人。

在半年前,我还在狂撸 Milvus 2.0 的架构设计与工程实现,相信现在屏幕前的你也还在熟悉 2.0 的新内容。今天,我满心欢喜地给大家介绍我们最近开的新坑 —— Towhee。没错,这是 Zilliz 的同学们重点打造的第二个“鸟”项目(Milvus 是一种鸢,Towhee 是长尾巴红眼雀)。我们希望构建这样一个系统,把 embedding 的技术门槛降到“海平面”,并且构建一个横跨中美开发者的技术社区。Towhee 这个项目挑战很大,需要系统技术,需要算法模型,更需要一个开放活跃的社区。不过,这会是一段很欢快的旅程,虽然才发车两个月,车上已经聚集了不少有趣的小伙伴们。我相信,从“万物皆可 embedding ”到 “万物容易 embedding” 是有路径可循的,让我们拭目以待 :)

孜捷,Towhee AI 技术运营与产品专家,斯坦福大学电子电器工程专业硕士,曾就职于美国雅虎公司。目前在 Zilliz 负责 Towhee 项目的社区运营,对健身和国际象棋颇有研究。

在 Towhee 产研团队工作是一件我认可的、在技术上很有品味的事情。我们为机器学习制作一个框架,希望让用户上手简单、部署便捷,哪怕是不懂计算机的用户也可以用几行代码跑机器学习模型和机器学习 pipeline。如果这项技术得到普遍应用,将为社会创造巨大价值。从零到一做出一个前所未有的、利他的项目,这样的经验恐怕在大厂很难获得。欢迎你加入我们,加入这个独立、开放的团队,一起实现自我、改变世界!

琦聪,Towhee 高级算法工程师,浙江大学计算机专业博士,曾就职于阿里巴巴。目前在 Zilliz 负责 Towhee 项目的算法框架开发工作,研究领域包括计算机视觉、图像/视频理解、人脸识别、三维重建等。

Towhee 可以把各式各样的 AI 模型接入进来并灵活调用,这是项目最有趣的地方。在 Towhee 项目中能够学习到很多做普通业务难以学到的知识和技能,也能从团队的小伙伴身上学到很多,团队内成员特点鲜明,都有各自擅长的领域,形成了良好的互补。技术上遇到难题时,我们可以随时找组内的小伙伴交流,每天都能明显感受到成长,这是我在这个团队最大的收获。如果你渴望快速成长,欢迎加入 Towhee 产研团队!

俊辰,Towhee 高级算法工程师,国防科学技术大学飞行器设计专业硕士,曾职于华为、腾讯。目前在 Zilliz 负责 Towhee 项目的图像算法和工具研发,工程项目经验包括航天、无人机、AR / VR 等。爱好户外,曾徒步穿越乌孙古道,养了三只猫。

包容、务实、注重团队协作和效率、和时间做朋友,这是我在 Towhee 团队工作时感受到的气质。在这里,我多了一个践行技术价值的思路——开源。面对爆发式增长的非结构化数据,我们希望通过开源而非闭源的方式去帮助更多人解决问题,为不同领域和专业的用户提供高效和友好的工具。如果你对技术充满激情,欢迎来到 Towhee 项目,把按捺已久的新点子付诸行动,收获丰富的实战经验。

俊杰,Towhee 高级 AI 平台开发工程师,四川大学计算机应用硕士,曾任职于阿里巴巴、华为。目前在 Zilliz 负责 Towhee inference 框架开发工作,关注分布式系统、大数据、存储等技术方向。

Towhee 项目现在处于起步阶段,从零到一完整地参与项目的设计与开发,我相信这样的经历对于个人成长是非常有帮助的。我们团队众星云集,团队成员大多来自于一线大厂,技术能力在线、有丰富的工作经验,和他们一起工作能够学习到很多知识和经验。欢迎大家加入 Towhee 产研团队,和 Towhee 一起成长!

凯源,Towhee 产研团队 AI 系统工程实习生,伦敦大学学院计算机科学专业硕士。目前在 Towhee 项目组主要参与系统方面的工作。在工作学习之余爱好看电影和运动,国家二级运动员一枚。

自五月份加入 Zilliz,我从一个真正意义上的工作小白到现在能够为开源项目贡献代码。实习期间,组内的工程师们都非常乐于提供帮助和支持,我在专业能力和人生方向上都成长了许多。我慢慢开始规划自己的职业生涯,逐渐明确了自己的目标——钻研和探索系统架构方向。希望未来能在团队和个人的共同成长中进步得更快一些,成为一名优秀的工程师,为社区做出更多贡献。

03

我们在招

AI 算法工程师

工作职责:

面向图片语义 embedding 这类任务,构建 state-of-art 的预训练模型库,以及与算法模型库配套的极易用的调用框架。主要职责内容包括:

  • 追踪学术界和工业界的最新成果,持续保持预训练模型库与前沿技术的同步;

  • 算法模型的深度优化;

  • 设计算法模型库的组件接口以及调用框架;

  • 处理不同框架上模型之间的互操作性,可以在主流框架之间迁移模型;

  • 参与构建开源技术社区。

任职要求:

  • 计算机相关专业统招本科及以上学历,1-3 年及以上 AI 领域(CV/NLP/多模态方向优先)研发经验;

  • 熟悉 AI 算法从立项到落地的全流程,包括客户沟通、定义问题、建立模型、实现模型(调参、误差分析、迭代优化) 、算法部署、上线后续跟踪等;具备模型调优的实战经验;对神经网络模型有系统化的理解;

  • 熟悉 Python C/C++,熟悉 TensorFlow、PyTorch 等任一主流框架,对 AI 周边生态系统有比较全面深入的了解;

  • 有产品工程实践落地、大规模 AI 系统开发设计经验者优先;

  • 在 AI 顶级会议上发表过文章者优先,在 Kaggle/天池比赛平台上排名靠前或者有获奖经历者优先。

深度学习平台研发专家

工作职责:

面向非结构化数据 embedding,构建极易用的调用框架以及后端数据与模型平台,支撑 state-of-art 的预训练模型库与数据集的共享、维护、访问。主要职责内容包括:

  • 系统的架构设计、实现、优化;

  • 通过系统手段降低系统/平台与模型工作的 gap;

  • 不断跟进前沿技术,并进行工程化沉淀;

  • 参与构建开源技术社区,沉淀并输出技术影响力。

任职要求:

  • 热爱开源的相关工作;

  • 有底层系统/框架的设计、研发经验,扎实的算法和数据结构基础;

  • 有基本的英文读写能力,能够顺畅的阅读论文与技术文章,能够通过英文与社区进行书面交流;

  • 熟悉 pytorch tensorflow mlflow kubeflow 等主流框架者优先;

  • 主导或参与过优秀开源项目者优先;

  • 有云原生系统软件研发经验者优先。

AI 算法实习生

工作职责:

面向图像和视频等非结构化数据,包括并不限于语义 embedding 任务。主要职责内容包括:

  • 与资深工程师一起扩展算法模型库和工具箱,改进开源软件的功能和性能;

  • 参与建设开源社区,协助团队解决用户问题。

任职要求:

  • 热爱算法和互联网,有开源精神,有耐心,对算法产品有兴趣;

  • 熟悉 python 开发以及 pytorch、tensorflow 等框架;

  • 有解决问题的思维,剧本基本的中英文沟通表达能力,英语能力大于等于六级或有英文环境经历;

  • 有算法工程化经验优先,有会议文章和比赛成绩优先;

  • 本科及以上学历,实习时间 3 个月以上,每周至少 4 天。

04

我们等你来

如果你热爱开源

如果你对「人工智能」「机器学习」充满热情

X2Vec, Towhee is all you need!

点击扫码,即刻投递

热招 | 我们是 Towhee 产研团队相关推荐

  1. PingCode Wiki ——国内最顶级的产研团队知识库产品介绍

    PingCode Wiki 在发布之初,就是希望打造成一个 面向产研组织的知识管理系统.通过结构化沉淀高价值信息,形成组织完整的知识体系.通过便捷地分享和传播,轻松提升知识的流转效率,更好地成就组织和 ...

  2. 1年2轮融资团队2倍扩张,180人的产研团队如何有序协同?

    远程视频中的张翼翔意气风发,金句频出,屏幕侧的我们能非常清晰地感受到:他非常明白当前正在做什么,以及未来他要去到哪里. "去年整个工厂行业都在数字化,转型已经从good to have 到 ...

  3. 适用于产研团队协作工具有哪些?盘点6大类协同办公软件

    团队协作工具在提高团队协作效率.质量和灵活性,降低成本等方面都有着不小的作用.而根据协作内容.团队等特点的不同,团队协作工具可以分为多种类型,常见的包括: 即时通讯工具,用于实时交流和沟通,其中又可分 ...

  4. 30人的产研团队如何高效协同?

    简介:工具选型及使用建议对于中小企业,基本都不会自己搭建服务器和机房进行部署,而是选择各大云平台,选择一款SaaS项目管理工具可以极大的降低运维成本. 作者介绍:以诺行CTO 刘自强 团队使用云效3年 ...

  5. 产研团队任务管理工具:盘点国内外9款知名任务管理系统软件

    以下是10款国内外最知名的任务管理系统:1.研发项目任务管理-PingCode:2.通用项目任务管理-Worktile:3.免费开源研发任务工具-Redmine:4.海外著名项目任务管理工具-Asan ...

  6. 产研团队福音!摹客「设计任务管理」独家上线(文末有福利)

    一款优秀的互联网产品,需要设计团队多人通力合作,并与甲方或公司内部充分沟通.交换信息.批阅审核.摹客此前帮助大家解决了产品.设计.开发.测试等环节协同工作的难题. 但流水线上每一个环节的质量如何保障, ...

  7. 以AI绩效管理切入产研赛道,方云智能获近千万元天使轮融资

    数据智能产业创新服务媒体 --聚焦数智 · 改变商业 近日,AI研发绩效管理平台"方云智能"公布近千万元天使轮融资,本轮投资方为盈动资本和寒武创投.据悉,本轮融资资金主要用于产品技 ...

  8. 求职有 Pulsar | 小红书、Shopee 新加坡、StreamNative 多个热招岗位

    云原生时代消息队列和流融合系统,提供统一的消费模型,支持消息队列和流两种场景,既能为队列场景提供企业级读写服务质量和强一致性保障,又能为流场景提供高吞吐.低延迟:采用存储计算分离架构,支持大集群.多租 ...

  9. 追一科技热招职位来袭:AI新世界,不做旁观者

    追一科技·更美好AI世界 追一科技是国内领先的人工智能公司和AI数字员工提供商,我们主攻深度学习和自然语言处理,提供智能语义,语音和视觉的AI全栈服务. 我们的一站式企业智能服务平台AIForce能与 ...

最新文章

  1. 你可能不知道的switch
  2. theano中的Rop和Lop的详细解释
  3. ActiveMQ objecmessage 无法调用问题。
  4. oracle 的基本命令(一)
  5. Android用按钮确定单选框,Android RadioButton单选框的使用方法
  6. java 基本数据类型 容器_Java 基本数据类型
  7. 监听者模式 java_java监听者模式
  8. linux下安装12c中间件,linux下静默安装 weblogic12.2.1.3中间件
  9. 利用MFC Picture Control控件 加载bmp,png
  10. warning LNK4099:未找到 PDB 问题解决方案
  11. idea远程调试修改代码_利用IDEA远程调试代码
  12. 提高计算机访问硬盘的速度慢,嫌电脑速度不够快?教你5招提升硬盘性能!
  13. mybatis discriminator 鉴定器
  14. 2022-2027年中国苹果树种植行业市场全景评估及发展战略规划报告
  15. IB数学考试真题题型解析
  16. GCC9.4 memset() clearing an object of type with no trivial copy-assignment [-Werror=class-memaccess]
  17. python读书笔记—读写文件
  18. 奥维查看行政边界_全国乡镇行政区划数据乡镇边界数据查询获取方式
  19. kali密码破解笔记
  20. SSL数字证书之CA根证书、CA中间证书和SSL证书

热门文章

  1. 大白菜装机教程win10_详解戴尔电脑一键重装系统win10教程
  2. 【Linux】2. Linux实操命令
  3. 【技能】使用纯CSS+html写出方向箭头,简单大方,好看
  4. 2021年安徽省职业院校技能大赛网络搭建与应用竞赛
  5. scratch设计跑酷游戏_我如何使用Scratch设计游戏
  6. 10个iPad Air常见小问题及解决方法汇总
  7. 火狐 浏览器 历史版本下载地址
  8. numpy函数:arange(),reshape()用法,
  9. 硬件:Nand Flash、Nor Flash
  10. 调和曲线图和轮廓图的比较