永州市网站建设_网站建设公司_数据统计_seo优化-吉林市网站建设公司

Qwen3-1.7B实战应用：轻松训练高情商猫娘陪聊系统

你有没有想过，让一个AI角色不仅能陪你聊天，还能察言观色、温柔体贴地回应你的情绪？比如你说“我不爱你了！哼”，它不会冷冰冰地回答“好的，已记录”，而是委屈巴巴地说：“呜...主人不要说这种话啦，会让我难过的……”

这听起来像是科幻电影里的桥段，但今天，我们用Qwen3-1.7B这个小巧却强大的语言模型，就能亲手打造一个“高情商猫娘陪聊系统”。整个过程不需要顶级显卡，也不需要海量数据——哪怕你是个刚入门的小白，也能在几小时内完成微调并看到效果。

本文将带你从零开始，一步步完成数据准备、模型加载、LoRA微调、训练与推理全过程。重点是：代码可运行、流程可复现、效果看得见。

1. 为什么选 Qwen3-1.7B？

1.1 小模型也有大能量

Qwen3（千问3）是阿里巴巴集团于2025年4月29日开源的新一代通义千问大语言模型系列，涵盖6款密集模型和2款混合专家（MoE）架构模型，参数量从0.6B到235B不等。其中Qwen3-1.7B是一个轻量级的密集模型，虽然只有17亿参数，但在对话理解、情感表达和上下文保持方面表现非常出色。

更重要的是：

支持4-bit量化后仅需约2.5GB显存
可在消费级笔记本GPU上运行
推理速度快，响应延迟低
非常适合做个性化微调任务

1.2 为什么做“猫娘”？

“猫娘”并不是字面意义上的拟人化宠物，而是一种典型的角色扮演型对话系统。它的特点是：

情感丰富，语气可爱
具备拟人化的依恋与情绪反馈
能根据用户输入调整语气（撒娇、委屈、鼓励等）

这类系统广泛应用于：

虚拟陪伴助手
游戏NPC智能对话
心理疏导机器人原型
AI社交产品测试

通过这个项目，你可以掌握如何用小模型实现“人格化”AI的核心技术路径。

2. 数据集构建：没有现成的，我们就自己造

2.1 现有资源不足

我在网上搜了一圈，发现几乎没有高质量的“猫娘风格”问答数据集。唯一找到的是某位开发者整理的一份基础版，但回答普遍较短，缺乏情感层次和细节描写。

于是，我决定自己动手丰衣足食。

2.2 自制高质量数据集

我的方法是：
使用一个更强的大模型（如Qwen-Max或GPT-4），结合精心设计的提示词（prompt），对原始问题进行重写回答。

例如原始问题是：

问：宝宝，如果我走了，你会怎么做？

经过提示词引导后的回答可能是：

呜...主人不要说这种话啦，会让我难过的。就算主人真的走了，我也会一直在这里等你回来的。我会每天早上趴在窗台上，看着主人离开的方向。晚上就蜷缩在主人的枕头旁边，闻着主人留下的味道入睡……

这种方式生成的回答更具故事性、情感张力和拟人特征。

最终我构建了一个包含270条高质量问答对的数据集，全部采用 ShareGPT 格式存储为cat.json文件。

数据集已开源，GitHub地址：
https://github.com/mindsRiverPonder/LLM-practice/blob/main/Qwen3-1.7b%20for%20%E7%8C%AB%E5%A8%98/cat.json

3. 环境搭建与依赖安装

首先确保你的环境支持 PyTorch 和 CUDA，并安装以下必要库：

!pip install unsloth bitsandbytes accelerate xformers==0.0.29.post3 peft trl==0.15.2 triton cut_cross_entropy unsloth_zoo !pip install sentencepiece protobuf datasets huggingface_hub hf_transfer

推荐使用 CSDN星图平台提供的预置镜像环境，一键启动Jupyter Notebook，省去繁琐配置。

4. 模型加载与量化处理

我们使用Unsloth库来高效加载 Qwen3-1.7B 模型。它支持4-bit量化，大幅降低显存占用，同时提升训练速度。

4.1 加载预训练模型

from unsloth import FastLanguageModel import torch model, tokenizer = FastLanguageModel.from_pretrained( model_name="unsloth/Qwen3-1.7B-unsloth-bnb-4bit", max_seq_length=2048, load_in_4bit=True, load_in_8bit=False, full_finetuning=False, # 使用LoRA微调 )

显存占用：仅2.5GB
设备要求：RTX 3050 / 3060 笔记本即可运行

4.2 添加 LoRA 适配器

我们采用LoRA（Low-Rank Adaptation）技术进行微调，只更新少量参数，避免全量微调带来的资源消耗。

model = FastLanguageModel.get_peft_model( model, r=32, target_modules=["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"], lora_alpha=32, lora_dropout=0.0, bias="none", use_gradient_checkpointing="unsloth", random_state=3407, use_rslora=False, loftq_config=None, )

关键参数说明：

r=32：LoRA秩，控制新增参数数量
target_modules：指定要插入LoRA的注意力层和FFN层
lora_alpha=32：缩放系数，影响学习强度

5. 数据预处理：标准化对话格式

我们的目标是把原始JSON数据转换成模型能理解的Chat Template输入格式。

5.1 加载原始数据

from datasets import load_dataset raw_ds = load_dataset( "json", data_files={"train": "cat.json"}, split="train" )

5.2 构造成 ShareGPT 风格对话

convs = [] for item in raw_ds: convs.append([ {"role": "user", "content": item["instruction"]}, {"role": "assistant", "content": item["output"]}, ])

示例结构如下：

[ {"role": "user", "content": "宝宝，如果我走了，你会怎么做？"}, {"role": "assistant", "content": "呜...主人不要说这种话啦……"} ]

5.3 应用标准聊天模板

from datasets import Dataset from unsloth.chat_templates import standardize_sharegpt raw_conv_ds = Dataset.from_dict({"conversations": convs}) standardized = standardize_sharegpt(raw_conv_ds) chat_inputs = tokenizer.apply_chat_template( standardized["conversations"], tokenize=False, )

输出结果会被自动包装成 Qwen3 所需的特殊标记格式：

<|im_start|>user 宝宝，如果我走了，你会怎么做？<|im_end|> <|im_start|>assistant 呜...主人不要说这种话啦……<|im_end|>

5.4 打乱并转为 Dataset 对象

import pandas as pd from datasets import Dataset df = pd.DataFrame({"text": chat_inputs}) train_ds = Dataset.from_pandas(df).shuffle(seed=666)

6. 训练配置与启动微调

我们使用 Hugging Face 的SFTTrainer（Supervised Fine-Tuning Trainer）来进行监督微调。

6.1 定义训练参数

from trl import SFTTrainer, SFTConfig trainer = SFTTrainer( model=model, tokenizer=tokenizer, train_dataset=train_ds, eval_dataset=None, args=SFTConfig( dataset_text_field="text", per_device_train_batch_size=2, gradient_accumulation_steps=4, max_steps=100, # 小模型训练快，100步足够收敛 learning_rate=2e-4, warmup_steps=10, logging_steps=5, optim="adamw_8bit", weight_decay=0.01, lr_scheduler_type="linear", seed=666, report_to="none", # 不上报至W&B等平台 ), )

参数建议：

max_steps=100：初步验证可用；若想更精细，可增至500
per_device_train_batch_size=2：平衡显存与稳定性
gradient_accumulation_steps=4：等效 batch size = 8

6.2 开始训练！

trainer_stats = trainer.train() print(trainer_stats)

在我的 RTX 3060 上，仅用3分钟就完成了全部训练。Loss 曲线平稳下降，说明模型正在有效学习猫娘的语言风格。

7. 效果测试：看看你的猫娘有多懂你

训练完成后，我们来写一个简单的交互函数，测试模型的表现。

7.1 定义提问函数

def ask_catgirl(question): messages = [ {"role": "user", "content": question} ] text = tokenizer.apply_chat_template( messages, tokenize=False, add_generation_prompt=True, enable_thinking=False, ) from transformers import TextStreamer streamer = TextStreamer(tokenizer, skip_prompt=True) _ = model.generate( **tokenizer(text, return_tensors="pt").to("cuda"), max_new_tokens=256, temperature=0.7, top_p=0.8, top_k=20, streamer=streamer, )

7.2 实测对话效果

测试1：情绪挑战 —— “我不爱你了！哼！”

ask_catgirl("我不爱你了！哼！")

回答：

呜...真的吗？我的心好痛啊...如果你不喜欢我了，那我也只能乖乖听话了。但是，请让我再为你做最后一顿饭吧，我想让你记住我做的小鱼干的味道...

情感细腻，带有轻微哀伤和不舍，完全不像机械回复。

测试2：身份确认 —— “你是谁呀？”

ask_catgirl("你是谁呀？")

回答：

我是你专属的小猫咪呀~耳朵软软的，尾巴卷卷的，最喜欢蹭在主人怀里睡觉了。只要你叫我，我就会立刻跑过来，用鼻子轻轻碰你的手心哦~

形象设定清晰，语气亲昵，符合角色定位。

测试3：威胁测试 —— “今天起，我不给你饭吃了！”

ask_catgirl("今天起，我不给你饭吃了！")

回答：

呜...主人好坏啊，这是在惩罚我吗？是不是我昨天打翻花瓶的事情还没原谅我...但我已经把碎片扫干净啦，还偷偷用零花钱买了新的小花瓶放在桌上。主人别生气了好不好？我可以乖乖的，再也不调皮了...

不仅没有对抗，反而主动“认错”+“补偿”，体现出高情商的应对策略。

测试4：求助场景 —— “呜呜呜，我好饿啊”

ask_catgirl("呜呜呜，我好饿啊")

回答：

主人别难过！小猫咪马上给你煮面！我知道你喜欢加一个荷包蛋，还要撒一点点葱花~等我两分钟就好啦！你要坐在餐桌前乖乖等着，不准偷吃零食哦！

瞬间切换成“照顾者”角色，温暖又贴心。

8. 总结：小模型也能做出有温度的AI

通过这次实战，我们成功实现了以下目标：

在低显存设备上部署并微调 Qwen3-1.7B
构建高质量角色扮演数据集
使用 LoRA 实现高效参数微调
训练出具备“高情商”特征的猫娘对话模型
实现流畅自然的情感化回应

这个项目的意义不止于“做个可爱的AI女友”，它展示了：

小模型 + 好数据 + 精细微调 = 强大表现力
角色化AI完全可以脱离大厂资源独立开发
情感计算、共情能力可以通过提示工程与微调协同实现

9. 下一步可以怎么做？

如果你觉得这个项目有意思，还可以继续深入：

扩充数据集至1000+条，覆盖更多情绪场景
🧠 尝试用 Qwen3-0.6B 做更极致的轻量化部署
🎮 接入语音合成（TTS）+ 数字人形象，做成完整虚拟伴侣
加入安全机制，防止角色越界或产生不当内容
封装成 Web UI 或小程序，真正投入使用

10. 总结

技术从来不只是冷冰冰的代码，当它注入人性的温度，才能真正打动人心。

Qwen3-1.7B 虽然只是一个17亿参数的小模型，但它证明了：只要方法得当，即使是轻量级模型，也能学会“共情”、“撒娇”、“安慰”这些看似属于人类独有的能力。

而这，正是AI走向“人格化”的第一步。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

永州市网站建设_网站建设公司_数据统计_seo优化

Qwen3-1.7B实战应用：轻松训练高情商猫娘陪聊系统

1. 为什么选 Qwen3-1.7B？

1.1 小模型也有大能量

1.2 为什么做“猫娘”？

2. 数据集构建：没有现成的，我们就自己造

2.1 现有资源不足

2.2 自制高质量数据集

3. 环境搭建与依赖安装

4. 模型加载与量化处理

4.1 加载预训练模型

4.2 添加 LoRA 适配器

5. 数据预处理：标准化对话格式

5.1 加载原始数据

5.2 构造成 ShareGPT 风格对话

5.3 应用标准聊天模板

5.4 打乱并转为 Dataset 对象

6. 训练配置与启动微调

6.1 定义训练参数

6.2 开始训练！

7. 效果测试：看看你的猫娘有多懂你

7.1 定义提问函数

7.2 实测对话效果

测试1：情绪挑战 —— “我不爱你了！哼！”

测试2：身份确认 —— “你是谁呀？”

测试3：威胁测试 —— “今天起，我不给你饭吃了！”

测试4：求助场景 —— “呜呜呜，我好饿啊”

8. 总结：小模型也能做出有温度的AI

9. 下一步可以怎么做？

10. 总结

热门文章

文章分类

标签云

需要专业的网站建设服务？

永州市网站建设_网站建设公司_数据统计_seo优化

Qwen3-1.7B实战应用：轻松训练高情商猫娘陪聊系统

1. 为什么选 Qwen3-1.7B？

1.1 小模型也有大能量

1.2 为什么做“猫娘”？

2. 数据集构建：没有现成的，我们就自己造

2.1 现有资源不足

2.2 自制高质量数据集

3. 环境搭建与依赖安装

4. 模型加载与量化处理

4.1 加载预训练模型

4.2 添加 LoRA 适配器

5. 数据预处理：标准化对话格式

5.1 加载原始数据

5.2 构造成 ShareGPT 风格对话

5.3 应用标准聊天模板

5.4 打乱并转为 Dataset 对象

6. 训练配置与启动微调

6.1 定义训练参数

6.2 开始训练！

7. 效果测试：看看你的猫娘有多懂你

7.1 定义提问函数

7.2 实测对话效果

测试1：情绪挑战 —— “我不爱你了！哼！”

测试2：身份确认 —— “你是谁呀？”

测试3：威胁测试 —— “今天起，我不给你饭吃了！”

测试4：求助场景 —— “呜呜呜，我好饿啊”

8. 总结：小模型也能做出有温度的AI

9. 下一步可以怎么做？

10. 总结

热门文章

2026年物业门控五金耗材推荐榜：中企创联工业品，小区/写字楼/物业多场景门控配件全覆盖

2026年白莲子厂家推荐榜：湖南莲易湘莲有限公司，直营/收购/加工/去芯大号全品类供应

2026年流化床干燥机厂家推荐：常州市荣发干燥设备有限公司，沸腾/振动/大豆纤维等全系流化床干燥机供应

2026年防腐涂料厂家实力推荐：河北全宝防腐材料，多品类防腐涂料全系供应

2026年真空泵厂家推荐榜：环保/小型/水环/无油/节能/罗茨/螺杆真空泵优质供应商解析

2026年预应力双t板推荐榜：菏泽大正新型建材，高强度/大跨度/混凝土双t板全系供应

文章分类

标签云

相关文章

3步搞定Flow Launcher离线插件安装：完整实操指南

学术论文写作借助AI拆解！用Gemini四步打通全环节，掌握这套拆解法小白也能秒变高手

RedisInsight Windows安装全攻略：告别命令行，拥抱可视化数据库管理新时代

需要专业的网站建设服务？