AI创作产品，还没找到自己的形态

2025-06-13|葬爱咸鱼|6 个实体|5 条关系

「AI创作，无需修改」

上周，我写了一篇讲孙宇晨的文章炒作仙人孙宇晨。写作过程中，我用了两款 AI 创作产品：YouMind 和 Grimo。在深度使用后，我的感觉是：AI 创作产品依然处在一个非常初级的阶段，它们还没有找到自己真正的产品形态。特别是在信息输入这个创作的核心环节，大伙虽然开始思考，但都还没想清楚、处理好。 AI创作产品面临两个问题：内容小改不如重写，产品形态还未成型。先说 YouMind（youmind.ai）。 YouMind 创始人玉伯讲过很多产品理念，比如稿生万物，要做创作伴侣，而不是效率工具。我非常认同这些理念。实际用下来，我的感觉是，YouMind是前进一步的腾讯ima知识库。 YouMind 的核心功能叫 Board。你在输入框给它一个指令，比如我想研究 Peter Thiel。 YouMind 就会联网搜索，创建一个 Board，把找到的文章放进去，再写一个综述。这一步，有点像去中心化的 ChatGPT Deep Research。 YouMind 的优点在于，它强调让你阅读原始文本，而不是 AI 过度压缩后的报告。我非常认同这一点。Deep Research 生成的报告，我总觉得抓不住重点，废话太多，论点不鲜明，所选案例也平平无奇。所以，我从来没读完任何一份AI 写的长报告。玉伯聪明地避开了这一点，它不强调AI生成的报告，而是把找到的原始文本呈现给用户。 YouMind的知识库功能也挺不错。你可以手动创建 Board，上传资料，然后在输入框里和 AI 交流，调取相关文章。我写孙宇晨，向 YouMind 上传了将近 30 篇资料，总字数接近百万字。我问问题，YouMind 多数时候能比较清楚地回答。而且，它能调用 Gemini 2.5 Pro、GPT o4 mini 这些顶尖模型（但没有Claude Sonnet 4、 GPT o3），这比一些ima知识库只能用国产模型要好。 YouMind 产品里也有一些巧思。比如，AI 的回答能保存进 Board，成为知识库新的信息。 Reader 功能可以总结文章，方便快速阅读长文。

但是，YouMind 的问题也很多。它不支持上传 TXT、DOCX 文件，粘贴输入的长度限制是 4万字符，这对上传语音转录稿很不友好。处理长 PDF 时，比如我上传的 SEC 起诉孙宇晨的50页诉状，YouMind 就读取不到重点了，回答也答非所问。另外，YouMind 难以抓取微信公众号文章，很容易触发微信的反爬虫机制。在我上传了20 多篇资料后，YouMind 抓取其他网页链接也开始出问题，一篇 The Verge 的文章死活抓取不了，最后我只能手动上传 PDF。更核心的问题在于，YouMind搜集信息的准确性不高。比如我让它研究 Peter Thiel，明确要求找一手英文资料。结果它找来的资料里，只有一篇文章是Peter Thiel写的原文，其他都是二手总结。我又让它搜集 Peter Thiel 自己写的重要文章，它列出了5篇文章，但只找到一篇全文，其他都不符合要求。 YouMind 的思路是让 AI 帮助筛选信息，找到真正重要的信息。这个思路很好，但执行得不好。所以，在资料搜集阶段，YouMind 对我的帮助，只是辅助验证我的想法，或者在我记不清某句话出处时帮我定位一下。它在信息搜集层面确实认真思考过，比Deep Research 更尊重原始文本，但离找到真正重要的信息还有距离。搜集完资料，进入构思阶段。真正让我形成清晰认知的，还是那几篇我自己找到的深度报道和孙宇晨的自传。比如何瑫的特稿让我了解孙宇晨早期是什么样的人，财新记者的博客展现了孙宇晨刚回国时的形象， 36氪的特稿则描述了他现在的状态。

以及孙宇晨的自传书，里边有非常搞笑的细节，孙割先写自己13年就实现了财富自由，几页之后，紧接着写，他那会，每个月的薪水扣掉房租，「打Uber都得想半天。」这些一手信息才让我对孙宇晨有了完整的认知。但是找到一手信息，靠的是我的经验，我知道哪些人认真写过孙宇晨，AI并没有帮我发现新信息。然后，我口述了1小时17分钟，把所有想法零散但完整地表达出来，转录出来有13000字。有了这种高质量的原创信息输入，我可以让AI来写作全文了。接着用到的是 Grimo（beta.grimo.ai）。 Grimo 的定位是 AI 加编辑器。它在设计上有一个我觉得很有巧思的地方：不是一次性输入，而是把输入「化整为零」。你可以在文章的任意位置召唤输入框，让 AI 根据上下文来写几段话。这降低了信息输入的门槛，你不需要一次性想好所有内容，想到哪写到哪，AI就能帮你整合。它还提供了 Claude Sonnet 4、GPT o3、Gemini 2.5 Pro 这些顶尖模型。我尝试用 Grimo 来处理我那 13000 字的口述稿。它可以全选文章让 AI 处理。但问题是，我的工作流往往不止一步。比如，我让它根据口述稿写提纲，再根据提纲写全文。在处理这种多流程工作时，Grimo 没有显示对话记录，这让我有很强的不安全感。「AI+编辑器」的形态，在处理多流程任务时，我觉得不如 Chatbot 灵活。所以，用口述稿写初稿，我还是回到了老办法：直接调用 Gemini 2.5 Pro 的 API，让 AI 根据我的口述转录先写提纲，再写全文，生成了一篇初稿。拿到初稿后，我又尝试用 Grimo 来修改。比如我口述时没说清 SEC 起诉孙宇晨的具体罪名，想让 Grimo 帮我改准确。

Grimo 可以完成这个具体场景。主要是接入了GPT o3，利用o3强大的推理能力，能够找到 SEC新闻稿，获得相对准确的信息。但是，Claude 4、Gemini 2.5 Pro就都不行，得到的信息都不够准确、具体，重写的段落还是泛泛而谈。我问 YouMind 同样的问题，因为它处理长 PDF 的能力有限，给出的答案也比较模糊。最后，我还是把 SEC 诉状的 PDF 直接发给 Gemini 2.5 Pro，才得到了 SEC 起诉孙宇晨的具体罪名和事实。这其实还是那句话：「模型即产品」。当我需要非常具体、准确的信息时，第三方 AI 产品很难做到。我必须直接与最强大的模型本身（Gemini 2.5 Pro 处理长文本，GPT o3 推理网络信息）交互，才能得到我想要的结果。继续修改文章时，我突然意识到了AI创作的一个大问题——AI生成的内容，小改不如重新生成。我与其在一篇初稿上小修小改，不如让AI多写几个版本，反正调用API的成本几乎为零，再从3-5个版本挑一个最好的不就行了。我确实这么做了，Gemini 2.5 Pro 重写的新版本比我用 Grimo 局部改的要好。如果具体修改文章，让个别段落更深入、准确，这往往不只是文本修改，而是需要更准确的信息和思考。这部分工作，单靠编辑器 + Web Search 是不够的。至于调整文章结构，修改开头和正文呼应的内容，调整各部分比重，这些工作我仍然无法在编辑器里简单告诉 AI 来做。让 AI 修改全文，不如直接重新生成。

总的来说，写孙宇晨这篇文章，YouMind 和 Grimo 对我，确实只是辅助。它们的价值，也没有超过大模型本身。即便我觉得 YouMind 和 Grimo 都是很不错的AI创作产品。 YouMind比腾讯ima知识库做得好，在信息搜集上花了很多心思，但对我的帮助依然不大。因为我知道什么是真正重要的信息，我会直接到财新、The Verge、36氪搜索相关报道，这些是我的经验和积累。 Grimo 的「AI+编辑器」形态，很适合写作几百字以内的短文，比如商务邮件、LinkedIn动态、推特。它还有巧妙的「化整为零」的信息输入方式，但我实际用下来，还是觉得AI写作小改不如重写。总结一下，在深度使用AI创作产品，试图写作长文后，我的感想是： AI 创作产品要解决的问题，首先是信息输入。YouMind 需要更准确地搜集信息。当我让它找 Peter Thiel 写的重要文章时，它需要找到全文，而不是不完全的转载网页。然后是信息处理和输出形态。「AI+编辑器」是不是最好的方式？我觉得不一定。我让 AI 写全文，直接在 Chatbot 里多试几遍，得到一个80分的初稿，最后在公众号、飞书自带的编辑器里简单修改，可能比在AI产品的编辑器里操作更直接。所以，我觉得 AI 创作产品依然还没有找到自己的形态。 AI 创作产品的形态可以是什么呢？具体到我熟悉的AI写作上，我的想法是语音输入+AI开盲盒。语音输入好过文字输入，说话比敲键盘更原始，更适合AI来结构化。AI写作小改不如重写，可以让AI多生成几次后筛选。

最近，我也在和朋友开发一款AI写作产品，试验一下这个思路是否成立，希望能尽快推出。