园地是一个极佳的平台,也是我心目中最专业的古泉论坛。每次徜徉其中,我总在思考,是否能利用前沿技术,深入挖掘和释放园地中的知识宝藏。
曾经在某知识社区工作时,领导分享过一段经历:当时这家被称为“知识宝库”的公司面临的挑战,是如何高效挖掘并展示这些宝藏知识给用户。为此,他们与某狗的搜索团队合作,搭建了定制的搜索引擎。这不仅提升了知识服务的精准度,也显著提高了用户的活跃度。
如今,园地作为古钱币领域最权威的论坛,我设想是否可以结合最新的AIGC技术,打造一个独特的古钱币知识库?基于这一想法,我提出一些思路供大家参考。
2023年无疑是AIGC的“iPhone时刻”。自GPT-3.5问世以来,大模型的应用迅速普及。尽管彼时因海外访问限制和高昂的使用成本,工程化大模型的使用存在一定门槛,但今年以来,国内大模型崛起,其语义理解和生成能力已不逊色于GPT-4和GPT-4omini,而且成本更低、接口调用稳定、支持大量token处理。
试想一下,如果能将园地中的优质内容整合到本地知识库中,再结合大模型的强大语义理解和信息汇总功能,就可能打造出一个高质量的古钱币知识问答产品。这不仅有助于降低运营成本,还能吸引更多新用户,帮助他们解决实际问题,实现双赢。目前,基于RAG(检索增强生成)技术的解决方案已经相当成熟且成本可控。RAG通过整合本地知识库或搜索结果生成精炼的答案,能够为玩家提供精准且及时的信息。
在选择国内大模型时,我个人推荐Deepseek或Kimichat,它们性价比高且token调用充足。关于embedding功能,可以考虑开源的BERT模型,使用普通显卡即可轻松部署,大大降低了成本。在向量数据库方面,选择也相当丰富。如果我们能借助AIGC的力量打造一个强大的古钱币知识库,或许园地的知识将更加璀璨夺目!
下面是我用chatgpt、kimichat、密塔AI搜索崇宁通宝的版别结果,可以看出,基本都是依赖搜索结果进行总结,但是搜索的结果内容良莠不齐,导致结果很不准确。