回到顶部

论文赏析#4 直播|十亿规模数据集上高召回高 QPS 的 ANNS 单机方案

2021年11月25日 19:00 ~ 2021年11月25日 21:00
线上活动 (活动行Live)

收起

活动票种
  • 免费

    • 免费票
 已结束 (免费票)
付费活动,请选择票种
展开活动详情

活动内容收起


Paper reading

第四期

Paper reading直播是由 Milvus 社区发起的学术直播间,分享业内前沿学术论文,与大家交流人工智能与数据库领域最新研究方向。

本期论文分享,我们邀请到了 Zilliz 技术研究工程师许维芷,与大家共同讨论 发表在 NeurIPS 2019上的论文DiskANN: Fast Accurate Billion-point Nearest Neighbor Search on a Single Node”

对本期主题感兴趣的小伙伴,记得在下方预约我们 11 月 25 日(周四)晚 7 点的直播哦!


直播信息 


DiskANN: Fast Accurate Billion-point Nearest Neighbor Search on a Single Node” 是 2019 年发表在 NeurIPS 上的论文。目前有很多向量检索的 ANN 算法,这些算法在建索引性能、查询性能和查询召回率方面各有取舍。这篇论文提出了能够有效支持大规模数据的常驻 SSD 的 ANNS 方案:DiskANN。


该文提出了一种基于磁盘的 ANN 方案,该方案可以在单个 64 G 内存和足够 SSD 的机器上对十亿级别的数据进行索引、存储和查询, 并且能够满足大规模数据 ANNS 的三个需求: 高召回、低查询时延和高密度(单节点能索引的点的数量)。


文中的方法做到了在 16 核 64G 内存的机器上对十亿级别的数据集 SIFT1B 建基于磁盘的图索引,并且 recall@1 > 95% 的情况下 qps 达到了 5000, 平均时延不到 3ms。


论文名称:

DiskANN: Fast Accurate Billion-point Nearest Neighbor Search on a Single Node


论文链接:

点击【阅读原文】下载

https://suhasjs.github.io/files/diskann_neurips19.pdf


分享提纲:

1. DiskANN 概述 

2. 磁盘方案和 DiskANN 的动机及贡献 

3. DiskANN 是如何建索引和查询 

4. 实验结果 

5. 总结

 嘉宾介绍 

许维芷

Zilliz 技术研究工程师

墨尔本大学计算机科学本科及硕士。主要工作是各类向量搜索索引算法的调研、探索和实现,并合作研发 Milvus 的核心检索引擎模块。业余时间喜欢打篮球。


交流群与志愿者招募 


线上分享结束后,嘉宾还会在直播交流群内实时QA,欢迎大家扫码加入直播群与大家共同交流!


同时,我们热烈欢迎社区志愿者以讲师、议评人、合作直播等形式参与到 Paper reading 直播中。请通过直播交流群联系群管理员与我们取得联系。






举报活动

活动标签

最近参与

  • 王艳
    报名

    (4年前)

  • 微信用户
    报名

    (4年前)

报名须知

1、本活动具体服务及内容由主办方【Zilliz】提供,活动行仅提供票务技术支持,请仔细阅读活动内容后参与。

2、如在活动参与过程中遇到问题或纠纷,双方应友好协商沟通,也可联络活动行进行协助。

您还可能感兴趣

您有任何问题,在这里提问!

为营造良好网络环境,评价信息将在审核通过后显示,请规范用语。

全部讨论

还木有人评论,赶快抢个沙发!

活动主办方更多

Zilliz

Zilliz

Zilliz 是向量数据库系统领域的开拓者和全球领先者,研发面向 AI 生产系统的向量数据库系统。Zilliz 以发掘非结构化数据价值为使命,致力于打造面向 AI 应用的新一代数据库技术,帮助企业便捷地开发 AI 应用。Zilliz 的产品能显著降低管理 AI 数据基础设施的成本,帮助 AI 技术赋能更多的企业、组织和个人。

微信扫一扫

分享此活动到朋友圈

免费发布