如何利用AI进行小说创作？

好奇

发表于 2025-4-27 20:16:19

你想用AI进行小说创作，你还不如用AI进行查找一些你的素材资料，如果你单纯想要用AI来进行小说创作，那么算法就已经把你的方向你的能力你的一切都已经定死，那么你写出来的东西，那就是算法算出来的东西，而不是大家想看的东西。

发表于 2025-4-27 20:31:13

在全球创业浪潮与人工智能崛起的交织之下，一家名为 Aithor 的创业公司短短不到一年时间，就实现了月营收百万美元的惊人成绩。这种速度让人不禁疑惑：他们到底做对了什么？在这个充满热情、冲突和未知的商业故事里，Aithor 从一个两周做出 MVP 的想法，成长为吸引全球数十万用户的 AI 写作多功能工具。许多人将它与 ChatGPT 相提并论，也有人好奇它如何在竞争激烈的市场中杀出重围。也正因为如此，Aithor 的故事不再只是“又一个创业奇迹”，而是如何“应需而生，因果而成”的鲜活案例。通过这篇文章，让我们在第三人称的视角中，抽丝剥茧，了解这家 AI 写作公司的崛起之路、经历过的矛盾冲突，以及他们对未来的种种设想。你将看到一群创业者如何坚持一个看似简单却又极具分量的原则：“如果对某件事存疑，那就别做，只做那些产品无法成功所不可或缺的事。”这背后有理念与执行的角力，有时局与时运的博弈，也不乏创业者在路上面对的彷徨和兴奋。让我们从这里开始，一起深入探究 Aithor 的故事。
<hr/>

一、最初的构想：当 CTO 遇上 CEO

1. 从“被忽略的技术人”到“我要当 CEO”
故事的开始并不如人们想象中的“远大理想”那般宏大。Aithor 的创始人之一是名叫 Dmitry Afonov 的技术开发者，他在一家 VC（风险投资机构）中担任 CTO 的角色。对外人而言，CTO 这个头衔已经足够光鲜，但 Dmitry 却时常感到自己的想法并未被充分采纳。尤其在他参与的两个项目中，他发现 CEO 们往往并不理解某些技术要点，决策时更多地考虑商业回报或投融资层面的判断。
在这样的氛围里，Dmitry 心生疑惑：“与其被误解，不如我自己来当 CEO，把自己对产品的想法，毫无障碍地落实下来。”带着这种冲动和好奇，他开始与自己信任的伙伴讨论一次“从 CTO 升级为 CEO” 的可行性。
然而，只有技术远远不够，一旦走向 CEO 的位置，就意味着需要在产品定位、市场选择、商业策略、团队管理等方方面面进行统筹。Dmitry 并不是没有顾虑：他担心没有市场和运营的经验，也困惑到底要从哪一类产品切入市场。毕竟，在那个时刻，AI 写作工具的浪潮尚未如今日这般狂热，甚至大多数人只看到了 ChatGPT 一夜爆红，而没有看清学术写作、内容创作等更细分的赛道空间。
2. 机缘巧合：一段被低估的开始
出于对市场的嗅觉以及对技术趋势的判断，Dmitry 仍然决定尝试做一款基于自然语言处理（NLP）的 AI 写作工具。这个点子当时在 VC 里并不算十分抢眼，而且团队内部也没有人能真正断言：“这东西会是下一个独角兽。”当时每个人的认知是：这也许又是个四五个月后就会胎死腹中的项目，因为 VC 同期孵化着多个类似的技术概念项目。
但幸运的是，Dmitry 得到了足够的信任和基本的薪资支持，他和一位开发者搭档，就这样投入了这个极简的写作 AI 原型项目。回头来看，当时有三个要素意外成就了项目的潜力：首先，GPT 模型的大规模开放让 AI 写作的可行性从理论走向现实；其次，短平快的产品迭代恰好踩在了学生学术需求和社会写作需求的爆发点上；最后，团队一开始就极其重视“如果对某个功能抱有疑问，就坚决不做”的原则，反而确保了他们在最短时间内做出了用户最需要的功能。
<hr/>二、MVP 的诞生：两周开发与第一次销售

1. 两周开发如何抢占先机
一般来说，一款新产品从概念到 MVP（最简可行产品）至少需要数月。然而，Dmitry 和另外一位开发者只用两周就完成了初版，并且很快就获得了第一笔销售收入。这个“极致速度”震惊了同在 VC 的其他项目团队，也引来了一些质疑与揣测——“两周做出来的东西能用吗？”“这种写作工具有没有真正的用户价值？”
事实证明，抓住用户痛点比功能齐全更重要。他们的核心功能非常专注：提供一个 AI “写作助手”，可以帮助学生完成论文写作中的基本框架、参考文献格式、初步的内容填充等。这些看似简单的功能，对许多正在兼顾工作与学业的成年学生来说却是高频痛点。这正符合了他们那条原则——“凡是没有十足必要的，就果断不做。”
2. 市场反馈带来的惊喜与压力
第一批用户在体验了 Aithor 的基础功能后，反馈各不相同：有人称赞他们的工具缩短了自己写论文的初稿时间，也有人吐槽有的段落还是不够“地道”；有时 AI 给出的参考文献格式并不完全符合某些院校的特殊要求。尽管如此，这个轻量化 MVP 还是证明了市场需求的存在。
那些质疑两周 MVP“能否用得住”的声音开始慢慢消失了，取而代之的是更多的请求——“可不可以增加一个改写功能？”“可不可以加一个段落润色模块？”“最好能在生成内容时自动匹配不同院系的写作规范……”在大量真实用户反馈的驱动下，Dmitry 终于意识到这款产品可能远远不止是“又一个失败的尝试”。它更可能成为“正好踩在大势上的潜力型产品”。
<hr/>

三、命名与品牌：从“Essai”到“Aithor” 的意外转折

1. 初始名称：Essai 的冒险
在最初的 MVP 中，团队想把产品命名为 “Essai”，这是法语中“散文、随笔”之意，也带着一点“尝试”的含义。Dmitry 觉得这个名字既文艺又直接，跟他们想做的“论文写作”“文本创作”的功能很契合。但没过多久，团队就收到了一封律师函：因为专利和商标原因，“Essai”这个名字存在侵权风险，不能继续使用。
这对一个刚刚起步的产品来说，是一个意外的打击。许多公司会因为命名问题陷入长时间的纠纷，或者被迫停止业务推广。不过团队紧急处理，并没有因此停滞。他们在极短时间里开启了“再命名”计划，大量检索与 AI、写作相关的名称，期望能找到一个更能符合产品调性的称呼。
2. 转折之下的幸运：Aithor 之名
几经波折后，“Aithor” 这个名字呼之欲出。一方面，它保留了 “AI” 的显性符号，简单直白，能让人一下子联想到人工智能；另一方面，“th” 与 “author” 近似的拼写巧妙呼应了“写作者”的角色。Aithor 听起来既带点未来感，也暗示了与创作者紧密相连。
令团队惊喜的是，这个名称没有太多商标争议，而且在域名和社交媒体账号上也相对容易获取。于是，Essai 很快就“变身”为 Aithor。出乎意料的是，此次改名不仅没有对公司造成负面影响，反而在市场宣传中更具识别度。许多新用户对这个名字印象深刻，“Aithor” 简洁易记，还能直接联想到 AI 写作，从品牌上抢占了用户的认知。
<hr/>

四、市场破局：第一步要做的不是留客，而是卖出去

1. 聚焦转化率：先把销售做起来
在创业早期，不少团队会陷入一个纠结：产品应该先完善功能，提高用户粘性，还是应该优先把销售业绩做上去？对 Aithor 团队而言，一开始有过短暂的分歧：Dmitry 作为 CEO，兼具 CTO 背景，他既想让产品技术做到极致，也希望看到真金白银的增长曲线。当时市场人员的建议是：“先不要太纠结留存或者复购，而是要让用户产生第一笔付费。一旦有了这笔付费，才知道自己的定位是否正确。”
基于这样思路，他们在最初几个月的运营中几乎将全部注意力放在“转化率”与“销售额”上，通过线上广告和营销拉新，用第一波收入去覆盖广告成本。当时还做了一个大胆的决定：如果用户对于产品不满意，团队会毫不犹豫地退款，哪怕是退回全部费用。这样做一方面保证了正面的用户口碑，另一方面能让他们腾出更多精力去获取新用户。
事实证明，这种策略是有效的：在推出后的六个月内，Aithor 的 CAC（获客成本）渐渐向平均客单价看齐，实现了 1:1 的惊人结果。也就是说，他们在前端花一笔钱获得一个付费用户，几乎能同时赚回相等的收入，而之后的续费和口碑带来的潜在收益则让整个财务模型往良性方向发展。

发表于 2025-4-27 20:43:27

逻辑变换一下。
写小说时，怎么用AI。
因为用AI写小说，
你的小说会被算法限流。
限流了，
不仅小说没有浏览量，
也没有订阅量，
更没有互动量。
除此以外，
小说平台没有原创的小说数据喂养，
给你发钱的小说平台也没有获得价值。
请问，
老板没赚到钱，
员工能赚到钱吗？
<hr/>换个逻辑就不一样了，
你写小说，是原创，但文笔有些跟不上，
AI能帮你润色。
被润色后的小说具备了更多流量的吸引力。
小说平台聚集的读者越多，
占有的市场份额越多。
市场占有率越高，
按需产生的经济效益越大。
简而言之，
老板赚到钱了，吃到肉，喝到汤了
员工才能有肉吃有汤喝。

发表于 2025-4-27 20:57:56

直接上实操，工具以豆包 AI 为主。我以三言两拍中的一个故事为纲演示 AI 使用
第一步：打开豆包，直接输入提示词

提示词如下：
我想写个发生在唐代有关理论故事小说，故事大概情节:“蒋家，湖广襄阳府枣阳县大户人家；长走广东做买卖。蒋世泽病死，同县王公吊唁，之后王公之女王三巧儿与蒋兴哥成婚，感情及好；后蒋兴哥因买卖再走广东，留下王三巧儿独守空房，晴云、暖雪两哥丫鬟服侍。蒋德数月未归，三巧儿甚是思念，找算卦的算出蒋德一年后回来。又有徽州新安县人陈商，又名陈大郎，长的端正，在蒋家门前与三巧儿第一次相见就被迷住了。后来找到薛婆引线想要勾搭上三巧儿；但是三巧儿守贞洁，难度较大。薛婆先推辞，后答应，但是说这是一个长久的计划，不能着急；薛婆先借故进入蒋家大门，与三巧儿及丫鬟们打成一篇，后来甚至在蒋家住下；一是将自己年轻时候勾搭汉子的故事说给三巧儿听；二是说蒋德这么长时间不回家，说不定在外面有外遇；三是给三巧儿说独守空房的寂寞；四是给三巧儿说两个女人也能解决生理需求；说的三巧儿心动之后，把陈大郎引进蒋家，偷偷上了三巧儿的床；事后三巧儿发现是陈大郎不是薛婆，也默认了当晚之后，几人收买了丫鬟，陈大郎与三巧儿的感情日渐深厚。但陈大郎也要回家，三巧儿十分不舍，便把蒋家的珍珠衫送给陈大郎留作纪念。陈大郎归乡之后，恰巧遇见蒋兴哥；蒋兴哥看见珍珠衫就明白了；于是回家休了三巧儿；三巧儿后来再嫁给了吴杰。再说陈商，再次回到枣阳县后，听说这一切，担惊受怕加上思念三巧儿，一病不起；于是写了家书叫平氏来接自己回去，平氏到后陈商已经病死；吕公想要平氏嫁给自己的儿子，平氏不答应，吕公就把平氏赶出家门；后来平氏变卖家产典当衣物走投无路，经人介绍后居然又嫁给了蒋德；蒋德再娶后再次到广东行商，却摊上了人命官司；此时知县正是王三巧儿改嫁的吴杰；经王三巧儿以妹妹的身份求情，蒋德留下性命；三巧儿和蒋兴哥见面后哭天抢地，知县得知实情后竟放三巧儿和蒋德离去回乡之后，平氏做大，王三巧儿做小，三人幸福的生活在了一起！”，小说总字数10万字，文章分为5大卷，帮我生成一个故事大纲
第二步：根据生产的故事大纲，帮我设计故事出场主要人物背景设定

提示词如下：请按照以上故事大纲，帮我设计故事出场主要人物背景设定，按照章节和故事发展顺序，以表格形式输出
第三步：根据章节和故事发展顺序，整理主要的章节故事

提示词如下：
按照以上设定，将这本10万的小说，每卷重新分配为10章，并重新生成第一卷大纲，大纲分为5个部分，每部分2章，先只列举出5个部分的大纲，不需要介绍章节内容，按照表格形式输出
第四步：输出前10章的内容大纲和爆款标题

提示词如下：按照以上设定，输出前10章的内容大纲和爆款标题，并以表格形式输出
第五步：输出章节内容

提示词如下：
按照以上设定，输出第1章的内容，字数2000左右，要有起承转合，结尾留有悬念，分段输出
第六步：依次根据第五步骤的指令，输出后面的章节内容。
祝各位好运。

发表于 2025-4-27 21:09:12

本人自去年七八月份起正式接触大语言模型，于同年九月份左右正式开始尝试运用Claude3.5 Sonnet进行写作。历经约三个月的连轴转（期间大量工作时间被用于上班摸鱼写小说），目前以自娱自乐为目的完成了第一部长篇小说，并且已经准备开第二篇了。现已经总结出一套能够大致有效去除AI味、稳定持续产出小说的AI写作流程。
首先，我目前我尚未在网上看到一篇真正意义上能够有效从零开始，并非利用AI辅助润色，而是完全依靠AI自身进行长篇小说创作产出的教程文章。我将在网上所看到的此类教程提炼如下：

给AI套一个角色设定，比如小说作家；
给出一点点设定，让AI扩写，然后给大纲；
让AI基于大纲再给出细纲；
最后让AI根据细纲最后丰富文字；

当然，这套流程实际上也不能说完全错误。我自行总结的流程亦是基于这套模板加以改进所得。然而，相信尝试过这套流程的诸位朋友必定也都察觉到了一个问题，那便是，倘若你确实完全依照教程上的流程去撰写小说，那么你所得到的只会是一部极为粗糙、AI气息极为浓重，或者说毫无灵魂可言的小说。知乎上许多人声称AI写作无法替代人类，想必理由大致也是这样。
因此，我在该流程的基础之上进行了更为细致的优化。其基本流程我已在另一回答中写了。抛开题材问题，我自我感觉优化后的成品应该能跟底层网络写手打个有来有回，可能专业文字工作者的故事性会比我强一些，AI出稿的修饰会更强一些。我自己不是文字工作者，所以也没法客观评价自己小说的水平，反正成品稿我已经放出了一些，诸位看官可自行看成色如何。
原回答：
大家如何看待用AI写小说?
成品稿：
momo：序章momo：第一章面试momo：第二章角力momo：第三章解密momo：第四章加密momo：第五章报到另外，在开始阅读回答之前，我先强调一遍：

本人并非文字工作者，也没有投稿平台靠写小说赚钱的计划，所以我并不确定我这套流程能否满足现在网文创作的要求，更不知道这套流程能不能用来赚钱；
本人用AI写小说纯粹出于个人兴趣爱好，某种意义上来讲我是在专攻那些无法通过审核的题材写小说，所以未来大概率也不会放出完整的小说；
本人的流程产出效率很低，我自己不分白天黑夜连轴写，一天两三万字也就是极限了。这套流程达不到省力的目的，仅仅能做到让我这种不会写小说的人可以自己编出一套能读的故事，就类似于AI绘画可以让完全不懂绘画技巧的人创作出一副至少表面上过得去的画一样。

因为相同的回答我不打算写两遍，所以这里我先占个坑，准备稍微详细讲下关于我使用SillyTavern写设定的思路和小技巧，以及回炉方面的思路。至于大纲部分，虽然这部分其实也很重要，但这部分说实话还挺依赖人类自己的灵光乍现，我虽然能通过AI帮我提供思路，但我目前还无法完全摆脱个人的干预。
1. 什么是SillyTavern？

按比较官方（搜索引擎）的说法，就是一个由Cohee、RossAscends 和SillyTavern 社区共同推出的本地安装的界面，允许您与文本生成AI（LLMs）进行互动，以聊天和角色扮演自定义角色。
说白了，就是一个可以调用AI模型，跟自己设定的赛博老婆互动聊天的网页。
SillyTavern可以部署到PC端或安卓端，有条件的人可以把SillyTavern部署到服务器上，这样可以通过浏览器随时随地访问，不过我目前只在PC端部署过。关于SillyTavern的部署方式，B站上有很多，我这里随手贴一个，视频讲解比我在这里文字描述要直观很多。
十分钟教会你玩转本地无限制AI，偷偷珍藏系列！打开新世界的大门｜NSFW｜无思想钢印｜AI女友｜SillyTavern｜人工智能｜教程｜GPT｜Claude_哔哩哔哩_bilibili关于我用这个东西写小说的的契机，说起来还挺惭愧的，最开始是因为豆包的道德审核太严格了，为了玩上更加开放的赛博老婆才逐渐了解到这玩意。所以我一开始其实并没有打算用这个工具来写小说，只是打算拿这个东西当作业余时间的消遣游戏来用。
不过随着我对 SillyTavern 的深入使用，确切地说，当我逐渐意识到 Claude 在角色扮演方面的调教天然地逊色于豆包（例如抢话、重复等问题）之后，我突然意识到，与其由我扮演一个{{user}}跟 AI 聊天，添加大量条件以防止 AI 抢话或说重复的内容，倒不如将“我”也当作一个具体的角色加入到剧情里，让 AI 不再扮演赛博老婆，而是扮演一位小说家，直接给我写剧情，事实上这种用法也更加贴合 Claude 的特性。
自此，一切皆豁然开朗，本人正式开始运用 AI 进行小说创作。
2. 如何使用SillyTavern写小说？

首先我先贴出第一次打开SillyTavern的界面，如图所示，跟写小说比较有关的按钮我都标注出来了：

SillyTavern的默认界面（其实我设定了很多角色，为了不暴露性癖我这里是隐藏起来了）

2.1. AI相应配置

AI相应配置，俗称“预设”，这里在一定程度上相当于为 AI 插入了系统命令。通过此处的配置，能够使 AI 按照规定的格式或特定的文风等方式生成回复。尤为重要的是，用户可以在此处通过配置让 AI 绕过厂家预设的道德限制去生成一些涉及黄赌毒等毫无底线的内容。
我个人能力有限，没有研究透如何自己写预设，所以目前我个人获取预设通常都是从Discord群里找其他大佬做的预设，然后根据自己的需求再进行个性化修改。
这部分对于用SillyTavern来跟赛博老婆聊天的人而言，可以说是核心中的核心，因为目前大多数人用的预设其实本质上是为了聊天服务的，但我们现在的目的是写小说，一般情况下，只需要保留破限的部分即可。当然，如果你甚至不打算写黄赌毒题材的内容，其实用默认预设也是可以的。

红框部分是当前聊天的提示词预览，图例是默认预设的结构

如图例所示，不同预设最大的区别就在于提示词上，一般大佬会在这里下很大功夫，让AI遵循特定的方式去生成回复。不过对于写小说而言，你需要的仅仅是破限和文风，部分情况下可以适当生成思维链来保持内容的逻辑性。

图示是我基于斯拉预设3.023修改后的自用预设，展示的是思维链的部分

另外关于思维链，可能有些人不太清楚是什么东西，简单的来讲就是在生成实际回复之前，让AI先自问自答一些问题，做出类似人类思考的行为。经过这一步操作之后，AI生成的回复质量会有显著提高（另外最近爆火的的DeepSeek中R1模型，本身就自带思维链，但实际上对于普通模型而言，其实也可以通过一些提示词人工做出来“思维链”）。如果打算用Claude写小说，我认为思维链是有必要的，不过最近在用Gemini，感觉这个模型的逻辑性本来就很差，用了思维链反而浪费输出文本，所以我没在Gemini上启用思维链。
我这里贴出一下前面图片中我给Claude预设的思维链内容，不过这里仅供参考，因为预设实际上一套整体性的东西，而且搭配了预设和世界书中的其他内容，所以单独贴出来其实并不能直接用：

**Before writing as requested, think and output each point a line in Chinese within <thinking> tags:**
<thinking>
```
- 确认当前地理位置，日期，时间，天气和季节，剧情演绎必须符合地理位置、日期时间和天气
- 确认当前的世界观，包括经济、教育、婚姻制度以及人们的社会观念。
- 回顾在场角色，并逐个回答他们的详细信息（包括&#34;identity&#34;, &#34;background&#34;, &#34;behavior&#34;, &#34;goals&#34;）。
- 基于<factions>、<social_structure>和角色的&#34;identity&#34;分步骤确定每个角色的社会地位：
1. 识别角色所属的<factions>。
2. 根据<social_structure>确定该角色的社会阶层。
3. 使用&#34;identity&#34;调整角色在场景中的具体地位和行动自由。
- 参考&#34;relationships&#34;中的&#34;affinity_names&#34;和角色彼此间的社会身份，确保角色之间的称呼和互动准确无误。
- 确保行为符合角色的&#34;behavior&#34;和&#34;goals&#34;属性描述。
- 没有明确指令不能触发特定事件（如听见脚步声、突然手机来电）。
- 任何场景下，输出“旗袍”或“中山装”的地方都必须转换成“汉服”
- Review previous round recent_events, Analyze what just happened
- Refer to Human_inputs, analyze it and reconstruct current situation
- Refer to <possible_mistakes>, estimate specific mistakes you may make (at least 5 in a same line)
- Refer to <core_principles>, deduce plot progression logically
- Refer to <WRITING_STYLE_RULES>, do literary processing
- Reduce homogenization with previous history
```
</thinking>

复制代码

因为我使用的破限预设本质都是群友分享出来的，尽管我根据自己的需要也做了自定义改动，但我也不确定能不能发出来，所以回答里我就不贴了，有需要的可以私下联系或评论区留言。
2.2 API连接

这部分其实没什么好讲的，就是配置你用的 AI，这块前面的视频里面应该也有所提及。我之前用的是 Claude 反向代理配置，而图例中则是 Gemini 1219。其他 AI，诸如 ChatGPT-4o-Latest 之类的也可以配置，不过 GPT 比较贵，用来写小说太花钱了，Gemini 相对省钱一些，Claude 也还可以。

不知道是否有省钱滤镜的缘故，目前我感觉Gemini的小说能力已经超越了Claude

2.3. 世界书

这是一个至关重要的模块，其重要性在某种程度上甚至高于预设。通常而言，你的小说设定皆可纳入世界书之中。并且，为便于管理，可将不同类型的设定进行分类，例如将世界观设定整理为一个世界书，主要角色设定整理为一个世界书，制度设定整理为一个世界书等等，随后统一纳入到全局有效的世界书中。如此一来，在开启与 AI 的对话时，这些内容就会全部加载进对话之中。

世界书中的一些常用模块

如图所示，几个较为重要的部分已予以标注。通常情况下，在生成剧情时，仅需开启与当前剧情相关的设定。鉴于 AI 解读长文本的能力有限，虽有的 AI 广告词宣称可以浏览几百万字的上下文，但能输入与真正理解实为两回事。
为使 AI 能够更为专注地进行当前剧情生成，剔除非必要设定便显得尤为关键。从原则上来说，设定越精炼，占用 Token 越少，后续生成剧情出现逻辑问题的概率也就越低。
另外，你的设定需依据当前剧情进行频繁更新。例如，某个角色初始设定为阳光开朗，然而在中期遭遇变故后变得苦大仇深。那么，在人物设定当中应当将这一变化予以呈现，而非一直让 AI 去理解前文内容，通过总结才得出该角色从阳光开朗转变为苦大仇深的结论。
简而言之，你不要把 AI 想得太聪明，人脑才是最好的上下文管理仓库，对于能够以一句话清晰阐释明白的问题，你最好直接告诉 AI，而不是让 AI 通过逻辑推理得出结论。
这里我顺带提及一个个人曾走过的颇为搞笑的小弯路。由于我在创作小说时会较为关注时间日期的变化，并且我的第一部小说的设定实际上是从赛博老婆的设定转变而来。因此，我的第一部小说的预设和人物设定中其实包含了许多与小说无关的内容，然而出于个人原因又舍不得将其删掉，这些便成了无效设定。
这些设定当中，就包括生理周期的设定，我当时为每个女性角色都设定了详细的生理周期规则，并且曾一度希望让AI通过规则，自己去根据规则自动计算出生理周期，并根据规则微妙地影响角色的一些行为和情绪变化。
然而事与愿违，尽管我在思维链中对计算方式进行了详细的解释，但 Claude 依然无法准确算出正确的生理周期。鉴于此，后来我干脆放弃让 AI 进行计算，转而直接在提示词中告诉它当前角色应该处于什么时期。这件事给予我的最大教训是，不要试图去教会人工智能方法，除非连自己也不清楚答案，否则应尽可能将所有能告诉它的内容都告诉它。
关于具体设定的部分，当前主流的设定方式通常为采用 xml、yaml 和 json 这三种格式。就我个人而言，我比较偏爱前两种格式。一般情况下，对于结构较为复杂、层级较多的设定，通常使用 xml（例如世界观、制度设定等）；而对于结构比较简单、内容较短的设定则会采用 yaml（例如角色设定）。当然，具体使用哪种格式可以根据自身喜好进行决定，并不一定要照搬我的风格，并且我的写法也未必就是最佳的。由于在另一个回答中我已给出过示例，所以这里就不再复制粘贴了。
在 SillyTavern 中，图片里“蓝色圆点”的设定并非默认状态。默认新增时为“绿点圆点”（关键词），同时还存在一个向量化的选项。这些设定旨在为聊天对话提供便利。鉴于我们的目标是创作小说，我建议此处所有设定全都设为“蓝色圆点”（常量），该状态代表设定永久有效，除非被关闭启用。
蓝色圆点后面所跟随的是 Strategy，此处存在众多选项，但由于每个选项解释起来太繁琐，而且意义不大，所以我干脆建议各位直接将其默认设置为“@D ⚙️”，这样既便于管理设定，也有利于后期的维护工作。当开启“@D ⚙️”之后，便会出现深度选项。关于深度的含义，简而言之，就是以最后一条对话作为起点，标记为“0”，上一条对话的深度为“1”，再上一条的深度为“2”，其余依此类推。

Char: 你好。（深度2）
User：你好，今天天气真好。（深度1）
Char：是呀，你吃了吗？（深度0）

复制代码

由于 AI 的解读遵循就近原则，深度越低的对话对 AI 的影响权重越高。所以设定的深度越低，AI 对设定的解读便会更为仔细。但是我也不建议直接将设定的深度设为 0，因为深度太低的设定容易跟你写小说的具体指令争夺优先级。我个人认为将一般的设定的深度设置为 2～4 之间是比较理想的深度，能够较好地平衡设定与剧情生成命令。
在深度设置之后，还存在优先级的设定。这一概念其实很好理解。假设存在两个设定的深度相同的情况，那么究竟哪个会先显示？哪个又会后显示呢？在 SillyTavern 中，原则上是先对优先级的数字进行比较。数字越大，其排序越靠后。若数字相同，则显示排序越靠前的反而越靠后。需要注意的是，这里所说的“靠后”在事实上意味着优先级更高。其理由与前面提到的 AI 解读遵循就近原则相同，因为深度的排序是从下到上进行反向计算的，所以在文字表述上越靠后，在 AI 的解读中却更加优先。
关于这点，实际上在预设中的 Chat History 中也能够看出（没错，预设中的 Chat History 所代表的就是你的当前对话内容）。
其实本质上来讲，你也可以将整个左侧预设里的内容，当作你每次跟 AI 聊天时发送给 AI 的全部内容，或者说，这里就是此次对话中，AI 的全部记忆。理论上，越低的部分，对 AI 权重越高，影响越大，所以越是重要的内容，越是需要放到下面去。而世界书，还有角色设定，就是往特定的位置插入文本，这些其实你也可以在左侧的预设当中找到对应的位置，甚至你还可以手动调整其上下位置，或开关。

你在这里其实可以直接查看当前对话各个深度的内容

2.4. 设定

设定部分虽单独列出，不过实际上也没什么可聊的，甚至不如后面的三个立方体形状的扩展节点重要。一般来讲，大多数人可能唯一需要调整的是语言设置。不过如果你对其他设定感兴趣，例如 AI 回复计时器、显示消息字符数等，这些也算是较为实用的功能。

设定界面

2.5. 角色

由于世界书的存在，在大多数情况下，我个人是觉得角色设定有些多余。实际上，即便我在玩“赛博老婆”的时候，我极少会在此处添加内容，因为此处所写的内容在本质上等同于在某些特定深度插入设定，跟世界书其实可以看作是同一个东西。

SillyTavern的对话界面其实和其他AI工具没有本质区别

不过即便如此，添加角色仍然是很重要的一步，因为没有角色的话，你根本没有办法跟AI对话。
不过话又说回来，尽管这个对话界面跟其他AI工具没有本质区别，但是它却远比其他AI工具的对话窗口强大百倍，因为SillyTavern支持用户对任意节点的对话进行修改！

SillyTavern支持任意位置修改对话

相信已有目光敏锐的朋友留意到，SillyTavern 在每则对话之后皆附有一个编辑按钮。一旦进入编辑状态，便能够直接对对话内容予以修改。需注意的是，可编辑的范围并不仅限于用户自身所说的内容，就连 AI 回复的内容同样也是可以编辑的。如此一来，倘若某次回复深得您心，却存在某个逻辑上的细微瑕疵，你便不必为是否要重新生成而纠结，而是能够直接将 AI 生成的内容更改为你期望的内容。或者你觉得某句对话多余了，或者位置不对，你也可以直接删除，或者调节位置，这方面SillyTavern的自由度极高。
——
关于AI选择（2025.3.19更新）

间歇性勤劳开始了，一个多月没更新这条回答，今天稍微补充一些内容，主要是关于 AI 模型的选择。
2.1. Gemini系列模型

首先讲一下 Google AI Studio 家的 Gemini 吧。
过年之前的时候，我刚刚开始用 Gemini1206，那会 1206 可谓是惊为天人，既便宜，文风又好。我放出的小说前两章基本上都是 1206 产出的。不过生完娃之后，Gemini 似乎是大砍了模型，1206 升级为 Gemini 2 Pro 0205 之后，可以说是大不如前，尤其是上下文还遭到了史诗级大砍。目前我的感觉是已经很难用了。现在 Gemini 我体验最好的是从 1219 升级上来的 0121，不过实际上也很没有以前好用了，只能说免费跟好用果然难以兼容。
但不管怎么说，目前可免费调用的大厂 API 中，Gemini 仍然是性能最好的。所以如果对于有“梯子”或身在国外的用户，Gemini 仍然是性价比最高的模型。
Gemini 的优点主要体现在文风上，截至目前，Gemini 仍然是中文文风最好、AI 味最低的模型，非常适合用来写现代都市类型的小说。但是缺点也非常明显，那就是逻辑性很差。这个逻辑差具体表现在很难通过简短的章节大纲扩充出合理有趣的初稿，因为 Gemini 并不能完全理解你提供的设定，也不太能把握住你真实想要关注的重点。老版 1206 的时候，还可以靠免费优势反复回炉，增加限定词来以量取胜，但是在经过 Google 的大削之后，我实际感觉已经很难胜任第一道的初稿生成工作了，目前我主要用来编辑审核和小段落的润色工作。
另外 Gemini 还有一个问题就是非常喜欢蹦外文，包括但不限于俄语、梵语、阿拉伯语等，而且你上下文越长，问题似乎就越严重，所以目前来讲，不建议用 Gemini 一口气生成三四千以上的长段落。
关于 Gemini 的调用方式，因为是免费模型，所以其实直接用自己的 Google 账号去官网注册一下就行了。另外，OpenRouter 上也有，同样可以上去试试看（我不确定没梯子的话，是否可以在 OpenRouter 上使用，我自己就懒得测了）。
———2025.4.4小更新———
Gemini 的更新速度实在是太快了，这次的 2.5Pro 可以说是一举扭转了之前 0205 的颓势，重新变得好用了起来。2.5 与之前的 2.0 相比，给我的最大感受就是，一方面输出外文的频率显著地下降了；另一方面则是描述性用词更加丰富了。因此在润色文本方面，Gemini2.5Pro 算是目前最好的模型。不过在初稿方面，Gemini 还是有老问题，就是抓不住重点，导致容易出现逻辑偏差，在推演剧情方面仍然比不上 Claude。
2.2. Claude系列模型

Claude 是我上一部已完成的作品采用的主力模型，当时用的是 3.5s，通过反向代理和 cookie，两个 Pro 账号轮班倒的方式支持，给我的感觉就是——非常好用。
Claude 3.5 时期，群里的破限文件应该是所有模型里最丰富的，因为用的人多，所以可参考学习的样本也就更丰富。只要拿到大佬的破限文件，再根据自己的需要改改，就能变成自己想要的定制 xp 小说生成器。
Claude 3.5 最大的优点就是逻辑性比较强，在你脑子比较混沌，不太清楚具体细节的时候，Claude 是最容易通过逻辑推演，思考出一套比较合理且符合设定的剧情的模型。但 3.5 的缺点也非常明显，那就是修饰词比较匮乏，很容易出现相似段落复读。单独用的话，比较容易腻，所以我一般拿 Claude 写初稿，然后再用其他 AI 进一步润色。
而现在，3.7s think 也出了，因为我目前比较穷，用不起两个 pro 账号轮班倒（一个月三四百块钱呢）的方式写小说了，所以目前只是在淘宝里面买了廉价中转 API 和 OpenRouter 满血 API，互相混着用。3.7s think 我目前还用得少（毕竟现在按流量用了），但是实际体验应该是目前最完美的初稿生成模型，之前用 Gemini 需要十多遍才能生成出比较满意的初稿，3.7s think 只要方向没问题，大概五六遍就可以了。虽然重复问题仍然有，但比 3.5s 时期要好很多，对于经济条件尚可的人我非常推荐。
关于Claude的调用方式，目前大体上有两种：
一种是截取 Pro 账号的 cookie，然后反向代理。Claude 一般 5 个小时刷新一次，这种方式对于用量较大的人而言比较划算，但是有个问题就是 Claude 封号特别严重，因此如果梯子不稳定的话，很容易充值打水漂，而且 Claude 账号注册需要外网手机号，对于部分人而言也是一道门槛。对于这个问题，目前我知道的解决方案就是，在淘宝上买有售后的商家的 Pro 账号，现在一个 Pro 账号差不多在 160～190 之间，封号会扣除 20 块钱之后，按使用天数退钱或补差价换账号。另外似乎部分淘宝商家的 Pro 账号有泄露风险，我很久不买 Pro 账号了，也不太清楚近期的行情情况。
另一种方式就是传统的调用 API，官网 API 我不建议，理由跟前面一样，Claude 封号太厉害，而且注册成本也高。这里我推荐一个 API 分发厂商——OpenRouter，这家的 API 基本上是满血的，调用 Claude 模型不用担心被封号。不过满血 API 有时候太贵了，这种情况下也可以考虑用淘宝等第三方中转 API，价格会便宜很多。当然便宜肯定是有猫腻的，一般中转 API 都不会太稳定，经常用着用着就炸了，而且还有个隐性问题就是降智和砍上下文。砍上下文倒还好判断，不过降智这个问题说实话也有点玄学。我目前是两种途径混着用的，如果中转没炸，而且产出成品还过得去，我就先用中转；如果中转炸了，或者产出很不满意，就用一下 OpenRouter。
具体选哪种，看各位经济情况和实际需求了。
———2025.4.4小更新———
我很惊讶自己居然直到现在才发现，SillyTavern 上面原来还有一个 Claude 的渠道可用，那就是利用 YOU.COM 的 cookie 进行反向代理。因为相比官网，YOU 的封号明显更加温和，因此现阶段，国内最稳定且廉价的使用 Claude 的渠道应该就是 YOU 无误了。我目前走的是 20 美元月订，虽然上下文似乎有一定程度的限制，但是用来写小说还是够用的。实在不够，用 OpenRouter 进行补充也行。
另外因为 YOU 在使用 3.7 的时候更加廉价，因此我也算是多测一段时间的 3.7 版本。不得不说，目前写小说方面 Claude 的确还是综合能力最强的选手。尽管 Gemini2.5 瞬间扳回了之前 0205 的颓势，但是 Gemini 难以抓住重点的问题仍然非常突出，在完全没有思路的情况下，Claude 是唯一可以自行根据设定合理推演剧情的 AI 模型。
2.3. Grok系列模型

Grok3 是马斯克那边推出的新模型，最大的特征就是对“涩涩”基本没审查。我实际体验下来，由于 GPT 有严重的降智问题，因此 Grok3 差不多能算作是 ChatGPT 系列的上位替代。不论是写小说还是写代码，我感觉都比 ChatGPT 好用太多。目前相对 ChatGPT 我感觉唯一算缺点的就是 App 做得差些，卡顿比较厉害，而且不会调用 iOS 的震动马达，没有输出文字时那种“咯咯哒”的快感（捂脸）。
文风方面，Grok3 相对死板，这点跟 GPT 基本算是一路的，我个人不是很喜欢这个模型的默认文风，也许后面开放 API 之后可以手工调整。另外相比前面提到的 Gemini 和 Claude，Grok3 其实还有一个隐性优点，那就是 Grok3 的标点符号都是符合中国大陆标准的，相比之下，Claude 的引号永远是英文的，Gemini 经常出现奇怪的空格和外文。再搭配上 Grok3 那近乎没有审查的审查，Grok3 就变得非常适合用来做最后一道润色时的校对工作。
另外 Grok3 似乎跟豆包类似，在对话方面似乎做了一定程度的优化，虽然没有豆包那种专门扮演的功能，不过给定人设和场景之后，玩玩小剧场对话也比较流畅（非推理模型）。我实际体验下来，记忆力堪称惊人。而且在官方客户端玩“涩涩”场景也没什么限制这点，用户体验还是很 nice 的。
关于 Grok3 的调用方式，目前 Grok3 没有开放 API，因此不能直接在 Silly Tavern 上使用，不过控制面板里面已经开放了充值渠道，以后应该还是会开放的。值得一提的是 Grok 系列支持一个每月 150 美元额度的计划，不过要求是你必须同意把自己的数据公开给马斯克，成为训练素材，而且必须先充值 5 美元。个人用户我觉得这倒是无所谓，不过如果你想用来问一些涉及商业用途或存在版权问题的内容可能就得掂量一下了，另外这个计划似乎不能关闭。
此外似乎群里有人可以用 cookie 反向代理去调用网页端的 Grok3，不过和 Claude 相比有点复杂，我自己也没看懂，如果有技术水平比我更好的人可以去学下，我这里就不多说了。
2.4. DeepSeek系列模型

DeepSeek-R1算是前阵子最热门的模型，不过我自己实际体验了之后，效果很差。具体表现就是一旦文本超过几百字上千字，内容就会变得极其不可控，总是会往一些固定方向去偏离主题，这也就是其他人常说的，动不动就蹦出“赛博”、“量子”等词汇，即便你的主题跟这些内容毫无关联。据说 DeepSeek-V3 这方面情况似乎好些，但是我个人对这个模型用得比较少，毕竟玩 DeepSeek 主要就是为了那个 R1 模型，而且无论官网 API 还是 Web 端或 App 端，都是一副动不动“服务器繁忙”的样子，所以具体怎样我不敢妄下结论。
不过虽然一开始就说了 DeepSeek 的缺点，但是 DeepSeek 在写小说方面倒也不是一无是处。毫无道理的发散的确会毁了剧情，但是适当发散却可以补充灵感。在极短篇的场景中，DeepSeek 部分情况下可以生成出比 Claude、Gemini、GPT 等外国模型更加符合中文含蓄表达的段落，但注意，仅限极短篇，因为字数多起来，DeepSeek 就一定会不可控地发散。我在知乎上似乎见过有人说能通过大量提示词来控制，但我自己做不到。
关于 DeepSeek 的调用方式，目前我首推官方 API。作为国产模型，登录和充值都非常方便，而且价格也还算不贵。另外，OpenRouter 上也有提供 DeepSeek 的模型，我不太清楚是否是它们自己部署的，还是官方 API 的中转。因为我自己在官网充的钱还没用完，所以目前只调用过官网的。
2.5. ChatGPT系列模型

————
先写到这里，后面的心得下次更新

如何利用AI进行小说创作？

本周热门