An image to describe post

记录与移动出海有关的观察和思考,每周发布。

总第 135 期

主编 & 出版:Luke

编辑:Sonia

日期:2024 年 09 月 08 日

封面图

伊瓜苏瀑布 (Iguazu Falls)

An image to describe post

伊瓜苏瀑布的名字来源于瓜拉尼语或图皮语,意为“大水”。这组瀑布由伊瓜苏河形成,位于阿根廷米西奥内斯省和巴西巴拉那州的交界处,以其独特的阶梯状结构和三层玄武岩形成的两级阶梯式瀑布而闻名。

伊瓜苏瀑布的历史可以追溯到西班牙探险家阿尔瓦·努涅斯·卡韦萨·德·巴卡,他可能是第一个看到这些瀑布的欧洲人。1917 年,商人多明戈·阿亚拉加雷看到了这个地区的潜力,并开始发展旅游设施。随后,伊瓜苏瀑布成为了一个热门的旅游胜地。阿根廷和巴西分别在 1934 年和 1939 年建立了各自的国家公园保护这一自然奇观。1984 年和 1986 年,联合国教科文组织将这些国家公园列为世界遗产,认定它们具有“杰出的普遍价值”。

伊瓜苏瀑布不仅以其规模宏大而著称,还因其周围的丰富生物多样性和美丽的自然景观吸引了大量游客。瀑布的水流在不同季节会有所变化,雨季时水流量最大,常常能看到多重彩虹的奇观

An image to describe post

壁纸下载: https://www.bing.com/th?id=OHR.IguazuRainbow_ZH-CN6524347982_UHD.jpg

本周话题: RAG(检索增强生成)

在当今的人工智能领域,尤其是自然语言处理(NLP)中,如何结合语言模型的生成能力与外部知识库的检索能力成为解决复杂任务的关键。RAG(Retrieval-Augmented Generation,检索增强生成)正是这一创新性方法,它通过动态检索外部知识库中的相关信息,增强大型语言模型(LLM)的生成能力。RAG 能够为各类知识密集型任务提供更为准确、上下文相关且信息丰富的回答,广泛适用于问答系统、文本摘要、内容生成等领域。

RAG 的基本组成

RAG 系统由以下三大核心模块构成:

  1. 语言模型:RAG 使用预训练的大型语言模型(如 GPT 系列),这些模型通过整合检索到的外部信息片段,生成更具上下文相关性的回答。这一模块赋予了系统强大的文本生成能力,使其能够根据用户的查询提供自然语言回答。
  2. 外部知识库:这是 RAG 系统的知识来源,存储着大量结构化和非结构化数据。通过向量化处理,这些数据能够快速进行检索和匹配,帮助系统实时获取最新的知识。企业可以将内部文档、API 数据、行业报告等集成到知识库中,为业务提供持续更新的知识支持。
  3. 检索机制:检索机制负责根据用户的查询从知识库中提取相关信息片段。利用嵌入技术,系统可以识别用户输入与知识库中内容的语义相似性,从而找到最相关的信息,这种方式确保了系统在生成答案时引用了最新且可靠的知识。

RAG 的工作流程

RAG 的工作流程大致分为两个阶段,保证了信息处理的高效性和准确性:

  1. 数据准备阶段

    • 数据提取:从外部数据源中提取关键信息。
    • 分块:将大规模数据分解为易于管理的片段,便于后续检索。
    • 向量化:通过向量化技术,将信息转化为高维向量,以保留其语义特征。
    • 数据入库:将这些向量化数据存储在向量数据库中,支持快速且准确的检索操作。
  2. 检索与生成阶段

    • 问题向量化:将用户的查询问题转化为向量形式。
    • 数据检索:在知识库中搜索最相关的信息片段。
    • 注入 Prompt:将检索到的相关信息片段嵌入到语言模型的提示中,帮助生成更加精准的回答。
    • 生成答案:根据注入的信息,语言模型生成最终的回答,并以自然语言的形式呈现给用户。

RAG 的市场价值和优势

  1. 提升回答准确性,降低错误率
    在传统的语言生成模型中,错误回答或不准确信息时有发生,尤其当模型依赖陈旧的训练数据时。这给企业的知识管理、客户服务等业务带来风险。RAG 通过引用最新的外部知识库,确保生成答案的准确性,减少“幻觉”(hallucination)现象的发生。这一能力能够有效提升客户支持系统、智能助手等场景中的用户体验,降低错误信息带来的商业风险。
  2. 经济高效,快速响应市场变化
    相较于对大型语言模型进行重新训练或微调,RAG 通过检索外部数据来增强模型能力,无需频繁重新训练模型。这种方法不仅节省了企业的运营成本,还能够快速应对市场的变化,动态调整模型对实时信息的处理能力。RAG 在内容创作、客户支持、技术文档生成等场景中,提供了一种更经济高效的解决方案。
  3. 实时更新知识,保持信息的时效性
    许多企业在应对业务挑战时,需要持续跟踪行业信息、技术发展或市场动态。RAG 系统能够集成最新的外部知识库和行业数据,实时更新模型对新知识的掌握情况,确保企业生成的内容或提供的服务始终基于最新信息,避免过时内容对决策或客户体验造成影响。

应用场景及行业案例

RAG 技术广泛应用于各类业务场景,并在实际中展现出极大的商业价值:

  1. 企业问答系统
    大型企业往往需要管理海量的客户问题与内部知识。RAG 系统可以帮助企业构建智能化的问答平台,快速、准确地回应客户或员工的查询。通过实时检索外部或内部知识库,RAG 系统能够处理复杂问题,提供专业的知识支持。
  2. 内容创作与营销
    在营销文案、新闻报道、技术文档等内容生成场景中,RAG 能够根据最新的市场趋势、竞争情报等信息生成高质量的内容。这种生成方式不仅节省了内容创作的时间成本,还能确保内容的准确性和竞争力。
  3. 智能对话系统
    通过集成 RAG,企业的对话系统能够根据对话历史和上下文检索相关知识库内容,使得对话更加连贯且自然。对于跨行业的智能助手或客户服务机器人,RAG 系统能够提供实时、精准的回答,提升用户满意度。
  4. 教育与学习辅助
    教育平台可以利用 RAG 技术为学生提供个性化的学习支持。无论是处理复杂的学术问题,还是为学生提供扩展阅读,RAG 系统都可以动态检索并生成相关学习资源,帮助学生更好地掌握学习内容。

RAG 与传统技术的对比

与其他生成技术相比,RAG 在检索与生成结合方面具有显著优势。例如,传统的 API 调用系统往往依赖于特定的数据源,缺乏灵活性。而 RAG 可以根据上下文从多个数据源中动态检索最新信息,显著提高答案的准确性和丰富性。此外,RAG 可以与企业现有的知识管理系统集成,减少对现有技术栈的依赖,增强灵活性。

改进方向与未来展望

尽管 RAG 已经在许多领域展现出强大的能力,但未来仍有优化空间。企业可以进一步优化知识库的构建和维护流程,确保检索到的内容更加精准。此外,随着自然语言生成技术的发展,RAG 有望在更广泛的业务场景中应用,如医疗、金融等高度专业化的领域。

RAG 技术通过将外部知识检索与语言生成结合,为企业提供了一种能够动态适应市场变化的高效解决方案。未来,随着技术的不断优化与扩展,RAG 将在更多领域中展现其商业价值,为企业的智能化转型提供助力。

出海资源

《2024 年亚太发行商非游戏应用市场洞察》

2024 年上半年,Top30 亚太发行商非游戏应用总收入同比增长 20%,超 65 亿美元。《TikTok》收入 26 亿美元,稳居全球移动应用收入榜首。短剧应用收入激增 4 倍,全球累计超 7 亿美元。《DramaBox》日流水达 120 万美元,累计收入近 1.6 亿美元。移动电商应用《Temu》下载量创历史新高,累计下载量近 6.3 亿次。快时尚电商应用《SHEIN》全球下载量突破 10 亿次。《JioCinema》下载量近 9600 万次,位列印度本土应用下载榜首。来源: Sensor Tower

《2024 年北美独角兽企业动态》

2024 年北美已诞生 38 家独角兽企业。尽管风险资本市场紧缩,每月仍有独角兽企业诞生。TechCrunch 利用多个数据源追踪新晋独角兽,包括埃隆·马斯克的 xAI(估值240亿美元)等。七月的独角兽包括 Aven、Flo Health、Altana Technologies 等,六月有 Huntress、xAI 等,五月有 Altruist、Weka 等,四月有 Cyera、Monad 等,三月有 io.net、Perplexity 等,二月有 Blink Health、NinjaOne 等,一月有 ElevenLabs、Quantinuum 等。独角兽涵盖人工智能、网络安全、健康科技等领域。来源: TechCrunch

出海资讯

Character.AI 将向谷歌提供大模型技术授权

初创公司 Character.AI 宣布与谷歌母公司 Alphabet 签署协议,授予谷歌非独家使用其大型语言模型的许可。Character.AI 联合创始人 Noam Shazeer 和 Daniel De Freitas 将重返谷歌,加入 DeepMind 研究团队。通过这项协议,Character.AI 将获得更多资金,但具体金额未披露。Character.AI 总法律顾问 Dominic Perella 将担任临时 CEO。此前,Character.AI 已融得 1.93 亿美元风投资金。来源: IT之家

字节跳动推出对标快手可灵和 Sora 的“即梦 AI”

8 月 6 日,字节跳动旗下剪映团队研发的一站式 AI 创作平台 “即梦 AI” 移动版上架苹果 App Store 应用商店。即梦 AI 是一个专为创意爱好者打造的 AI 表达平台,其中包括 AI 图片创作、视频创作、探索创意世界等功能,效果直逼 OpenAI 的 Dall-E、Sora,以及快手旗下 AI 视频生成产品可灵、AI 图片生成产品可图。来源: 中关村在线

iOS 18.1 开发者预览版 Beta 发布

苹果发布了 iOS 18.1 和 iPadOS 18.1 开发者预览版 Beta 更新,带来了 Apple Intelligence 的预览。该 AI 功能仅适用于配备 M1 芯片或更高版本的 Mac 和 iPad,以及 iPhone 15 Pro 和 iPhone 15 Pro Max。更新包括改进的 Siri、新的书写工具、邮件和消息的智能回复等。此外,还引入了通话录音功能,支持多种语言。部分功能如 AI 图像生成工具和 ChatGPT 集成尚未开放。用户需注册苹果开发者计划才能获取更新。来源: IT之家

Google 推出由 Gemini 驱动的 3 项新功能,提升 Chrome 浏览体验

Google 在 PC 版 Chrome 浏览器推出由 Gemini 驱动的 3 项 AI 功能,包括识图找同款,商品参数对比,和通过自然语音查询搜索历史记录。来源: CN Beta

出海数字

6.7 万

ADX 海外版数据显示,2024 年 7 月海外市场在投游戏达 6.73 万款,环比 6 月的 6.47 万小幅上升。7 月全球手游素材榜中,中国微派网络的《WePlay》以 9820 个素材投放量居首,主要投放市场为中东、中国港台和东南亚。海外市场素材投放量和游戏投放数量均有所增长,美国市场素材投放量突破 80 万,日本和韩国市场接近 19 万和 18.5 万。未来 8 月,有多款中国大陆出海游戏值得关注,包括心动网络的《铃兰之剑》。来源: DataEye游戏观察

3000 亿美元

ChatGPT 和 Claude 将催生下一波初创公司,催生超过 3000 亿美元的市场。全球有 7.5 亿 Excel 用户,而 Python 和 JavaScript 分别只有 700 万和 1070 万用户。B2B SaaS 市场因 Excel 的分拆已达到 3270 亿美元,Salesforce 市值 1930 亿美元。2024 年,Excel 启发的新软件市场可能达到 5 万亿美元。微软 2014 年以 25 亿美元收购《我的世界》,体现了 Excel 的持久影响力。来源: 新智元

2000 万

华人女性 Xiaoyin Qu 创办的 AI 教育初创公司 Heeyo 完成了 350 万美元种子轮投资,最新估值 2000 万美元,投资者包括 OpenAI Startup Fund、Amazon Alexa Fund 以及 Pear VC。Heeyo 开发了一款面向 13 岁以下儿童的同名 App,应用内提供个性化 AI 聊天机器人,这些机器人可以讲 20 种语言,并帮助儿童设计个性化的游戏。来源: 有新Newin

16.9 亿美元

2024 年上半年,中国港澳台手游市场双端内购总收入达 16.9 亿美元,其中台湾市场收入 12.34 亿美元,同比增长 2%;香港市场收入 4.27 亿美元,同比增长 12.97%;澳门市场收入 0.25 亿美元,小幅下滑 3%。主要游戏类型为超休闲、角色扮演和博彩类。港澳台市场的买量素材投放量达 134 万组,同比减少 17.5%。热门游戏包括《出發吧麥芬》《Last War:Survival Game》《菇勇者傳說》等。搜索趋势显示,角色扮演类游戏在这些市场较受欢迎。来源: DataEye游戏观察

加一关注

ChiaTe(佳德)凤梨酥

An image to describe post

本周没 (tou) 有 (lan) 特别去找在全球市场成功的应用和游戏,写完 Doodle 的 Smores,想到了最近台湾的朋友给带的一款 ChiaTe(佳德)凤梨酥,本期就介绍一下它吧!

ChiaTe(佳德)凤梨酥是台湾地区广受欢迎的传统糕点之一,以其独特的口感和悠久的历史成为伴手礼的代表。ChiaTe 凤梨酥的成功源自于其精心调配的内馅和外皮的完美结合,以及品牌在文化和市场中的成功推广。ChiaTe 凤梨酥以凤梨与冬瓜混合的馅料为特色,酸甜适中,浓郁的果香与适度的甜度完美融合。外皮则采用优质奶油与面粉精制,酥松不腻,与柔软的馅料形成了独特的口感层次。这种经典的配方既保留了台湾地区传统糕点的风味,又通过创新使其符合现代人的口味需求。

成立于 1975 年的佳德糕饼,以数十年的经验积累了良好的口碑。2006 年,ChiaTe 凤梨酥荣获台北市政府举办的“第一届凤梨酥文化节”金赏奖,奠定了其在市场中的地位。此外,马英九也曾在推广台湾伴手礼时推荐过佳德凤梨酥,进一步提高了其知名度。随着台湾旅游业的发展,ChiaTe 凤梨酥成为许多游客的必买商品。其作为伴手礼的象征,不仅在台湾地区受到欢迎,还通过游客带到国际市场,成为全球华人社区中知名的台湾糕点。

ChiaTe 凤梨酥已经成为台湾地区传统美食文化的一部分,代表着台湾地区的饮食精髓。凭借其优质的产品质量、获奖荣誉和市场推广,ChiaTe 不仅稳固了在台湾地区市场的地位,还成功开拓了国际市场,成为全球认可的特色伴手礼之一。

跟着 Doodle 看世界

告别夏天,庆祝 S'mores

An image to describe post

今天的 Google Doodle 庆祝了美国经典露营小吃——棉花糖巧克力夹心饼干 (S'mores)。这种受欢迎的甜点不仅代表了美国户外文化的一部分,也唤起了许多人对夏日露营的美好回忆。

S'mores 的名字源自"some more"(再来一些),反映了它的美味让人欲罢不能的特点。这种甜点的制作方法简单:将棉花糖用长棍串起来在火上烤至金黄,然后夹在两片全麦饼干中间,中间再加一块巧克力。棉花糖的热量会使巧克力融化,形成一种独特的口感和味道组合。

S'mores 的历史可以追溯到 1920 年代。1925 年 9 月 9 日,一篇名为《巡逻队长外出》的文章首次提到在安德里国家女童子军营地引入了"some-mores"这种新食品。这种甜点在女童子军中迅速流行开来,并最终被简称为 "s'more"。
虽然传统的 S'mores 只有三种原料,但随着时间的推移,人们开始尝试各种创新配方。有些人会加入焦糖、果酱、花生酱或者用不同种类的饼干来替代全麦饼干。这种灵活性使得 S'mores 成为一种可以根据个人喜好定制的有趣甜点。

S'mores 不仅仅是一种食物,它还代表了美国户外文化和社交活动的重要部分。在露营、野餐或后院烧烤时制作 S'mores 已经成为许多美国家庭的传统。这种简单的甜点能够将人们聚集在篝火旁。分享欢乐时光,增进感情。
今天的 Google Doodle 通过生动有趣的动画展示了制作 S'mores 的过程,在唤起了人们对这种经典甜点的喜爱的同时,也提醒着夏季的结束和秋季的到来。希望我们珍惜与亲朋好友共度的美好时光,在日常生活中寻找简单的快乐。

保持关注

你可以关注「加一出海」公众号、Quail 平台 (chuhai.dev) 或者给编辑团队团队写信 [email protected],出海小伙伴们,加油 🚢

加一出海团队 ❤️ 为你呈现