wangjunqing001 LV
发表于 2025-4-22 12:46:09
我觉得,AI搜索更大的魅力在于其具备打破语言的边界的能力。
可惜,国内的AI搜索产品,包括海外很火的perplexity都不行。
于是,我们做了一款跨语种AI搜索引擎。
其实科技互联网圈的小伙伴都知道,如果一个知识是起源于国外(比如chatgpt、stable diffusion),那么国外的优质内容往往要比国内的多很多。
说句难听的,在这种情况下,国内的大部分内容往往是对国外内容的翻译或简单再加工,优质内容非常稀缺。
海外有个叫W3techs的网站,统计了2013年以来每年的互联网网站语言占比:
Historical yearly trends in the usage statistics of content languages for websites 这个表单也有争议,比如有人发现某个网站里如果混杂了英文,那会被当做英文站点。实际比例估计会比这个更高。加上移动互联网时代,相当多的中文内容其实是互联网爬虫抓不到的,所以姑且可以把1.2%看做是一个绝对下限。而上限可以参考Internet World Stats的2018年的一份调查——“中文用户占比19.4%”。
从这个角度来说,英文互联网甚至其他语言互联网的知识,理论上是跟中文互联网形成有效互补的,尤其是那些知识、信息发源地不在中国本土的内容,其内容的数量和质量理论上会比中文互联网好很多。
有了这个假设后,我还特意去搜了一个当天遇到的问题——stable diffusion 3.5的技术原理 我先用英文在perplexity上面去搜:
这详细的简直令人发指。
然后,我换中文再在perplexity上面去搜:
好家伙,比我预期的还要惨不忍睹。
我点进去了当时那仅有的几篇中文互联网文章,发现其中的信息量跟英文互联网的参考文献是完全不在一个层级的,这也难怪中文的answer会这么惨淡。
那一个很自然的想法就出来了——
跨语言的理解和生成,是大模型时代涌现出的特色能力,为何不能基于让大模型去帮提问者将query翻译成英文,阅读详尽的英文文档后,再用中文详细回答呢?
顺着这个思路,就有了今天要讲的产品,我给它起了个科技互联网人一眼懂的名字——FloatSearch AI。
内测传送门:
https://floatsearch.ai
产品定位
看到名字你可能会吐槽——这tm一点都不接地气啊。
确实,因为我仔细想了下,还是把它定位成一个小而美的产品——尽管这跟市场上的主流观点相悖。
一方面,跨语种搜索虽然是科技互联网、科研、媒体、医学、金融等领域专业人士的日常需求,但它对于普通大众来说,还是离得远了些。因此对于C端来说,我更希望它服务对生产力效率、专业性有较高要求的专业人群。
此外,这个产品推给一些身边的独立开发者/创业者朋友后,大家对于让我开放API这件事儿紧追不舍。所以,接下来我想面向B端和D端,开放FloatSearch AI的全链路API——从端到端的AI搜索(含参考文献、答案grounding、多轮搜索等features),到中间环节的通用搜索、正文内容低时延的抓取&重排序、多轮对话跨语种搜索词生成等。ps:有需求的小伙伴,记得在首页提交一下API申请 ShowCase
贴几个showcase感受下。
Query1:stable diffusion 3.5技术原理
https://t.floatsearch.ai/search?sid=fab4045a-8f90-493c-940a-d850c08aec73
Query2:openai o1用到了Q*技术吗
https://floatsearch.ai/search?sid=4cd2f1c7-d824-4ce2-9c62-2c8321b8df4e
Query3:做chatbot产品,要提升用户付费率,重点应该去解决工作需求还是情感陪伴需求?
https://floatsearch.ai/search?sid=c30868db-15a6-4d62-a08b-4f59597e0f35
Query4:我是一名UI设计师,想转行产品经理。我应该提前做哪些准备
https://floatsearch.ai/search?sid=d74b0906-6d3b-4c1a-a4e0-2c19afbebf48
最后
MVP版本可能存在诸多槽点和bug,请大家尽情把自己难以忍受的槽点丢给我叭! |
|