标签： AI

ai-agents-for-beginners：微软出品AI 学习教程，教会你开发 Agent

微软又出了一个挺不错的 AI 学习教程 ai-agents-for-beginners，用 10 节课的方式来教会你开发 Agent，教你开始构建 AI 代理所需的一切知识，支持多国语言。当然也支持中文

本课程包含 10 节课，涵盖构建 AI 代理的基础知识。每节课都专注于一个独立主题，因此您可以从任何感兴趣的地方开始！

如果这是您第一次使用生成式 AI 模型进行构建，请查看我们的生成式 AI 入门课程，该课程包含 21 节课，讲解如何使用生成式 AI。

课程截图

课程目录

课程	链接	额外学习资源
AI 代理简介及应用场景	AI 代理简介及应用场景	了解更多
探索 Agentic 框架	Exploring Agentic Frameworks	了解更多
理解 Agentic 设计模式	Understanding Agentic Design Patterns	了解更多
工具使用设计模式	Tool Use Design Pattern	了解更多
Agentic RAG	Agentic RAG	了解更多
构建可信赖的 AI 代理	Building Trustworthy AI Agents	了解更多
规划设计模式	Planning Design Pattern	了解更多
多代理设计模式	Muilt-Agent Design Pattern	了解更多
元认知设计模式	Metacognition Design Pattern	了解更多
生产环境中的 AI 代理	AI Agents in Production	了解更多

课程链接

github开源地址（中文）：https://github.com/microsoft/ai-agents-for-beginners/blob/main/translations/zh/README.md

2025年4月4日

4o Image：免费即时人工智能艺术4o 图像生成
4o Image ：基于 GPT-4o 的文生图工具，这个没啥说的，打开即用，无需注册，也没有次数限制，生成速度

几秒钟内将您的想法转化为令人惊叹的图像。我们的平台由 OpenAI 革命性的“gpt-4o”提供支持，让每个人都能使用复杂的 4o 图像生成。立即开始创作！

100％免费由 GPT-4o 提供支持无需登录无限生成，阿喵我测试了下，效果很好，不过需要注意：对中文支持不好，如果输入中文生成的内容可能会奇怪，所以最好是先把描述翻译为英文。生成速度很快！

只需 3 个简单步骤即可创作出令人惊叹的艺术作品
- 描述你的愿景
只需输入您要创建的图像的描述即可。您可以根据需要详细或抽象地描述。底层 4o 图像生成引擎依靠创造力蓬勃发展！
- 点击“生成”
点击生成按钮，让我们在“gpt-4o”上运行的强大的 4o 图像生成后端发挥其魔力。通常只需几分钟。
- 下载和分享
查看生成的图像。挑选您最喜欢的图像，以高分辨率下载，并与全世界分享您的创作。使用 4o 图像生成就是这么简单！

网站截图

网站特色

由最新的 `gpt-4o` 提供支持

体验 OpenAI 最先进模型的不同之处。得益于新 4o 图像生成功能固有的更快速度、更好的即时理解和更高质量的结果。

直观且用户友好的界面

无需任何技术技能！我们简洁干净的用户界面让 4o 图像生成的复杂过程对于每个人（从初学者到专业人士）来说都非常简单。

快速生成速度

利用“gpt-4o”的效率，以前所未有的速度生成图像。使用我们优化的 4o 图像生成管道，您可以减少等待时间，将更多时间用于创作。

高品质输出

生成适合各种用途的精美高分辨率图像。增强的 4o 图像生成功能可根据您的提示确保获得具有视觉吸引力且连贯的结果。

多样风格选择（即将推出）

在利用核心 4o 图像生成能力的同时，我们计划添加易于选择的样式，以帮助您实现完美的外观，从照片般逼真到卡通化。

可靠的 4o 图像生成服务

依靠我们的平台获得一致的性能，并在灵感迸发时获得尖端的 4o 图像生成技术。

网站地址

https://4o-image.com/
2025年3月31日
PDF-Craft：利用本地 AI 模型将 PDF 转换为其他格式的工具，目前支持 Markdown 和 EPUB 格式

PDF craft 可以将 PDF 文件转化为各种其他格式。该项目将专注于扫描书籍的 PDF 文件的处理，目前支持将 PDF 转换为 Markdown 和 EPUB 格式。

它通过逐页读取 PDF，利用 DocLayout-YOLO 和自研算法提取书页中的正文内容，过滤页眉、页脚、脚注、页码等元素。

对于直接扫描生成的中文 PDF 书籍页面，使用 OnnxOCR 进行文字识别，并利用 layoutreader 确定符合人类习惯的阅读顺序。

项目截图

功能介绍

PDF 转化为 MarkDown

此操作无需调用远程的 LLM，仅凭本地算力（CPU 或显卡）就可完成。第一次调用时会联网下载所需的模型。遇到文档中的插图、表格、公式，会直接截图插入到 MarkDown 文件中。

执行完成后，会在指定的地址生成一个 *.md 文件。若原 PDF 中有插图（或表格、公式），则会在 *.md 同级创建一个 assets 文件夹，以保存图片。而 MarkDown 文件中将以相对地址的形式引用 assets 文件夹中的图片。

转化效果如下。

PDF 转化为 EPUB

此操作的前半部分与 PDF 转化 MarkDown（见前章节）相同，将使用 OCR 从 PDF 中扫描并识别文字。因此，也需要先构建 PDFPageExtractor 对象。

之后，需要配置 LLM 对象。建议使用使用 DeepSeek，本库的 Prompt 基于 V3 模型调试。

如上两个对象准备好后，就可以开始扫描并分析 PDF 书籍了。

上述代码注意两个文件夹地址，其一是 output_dir_path，表示扫描和分析的结果（会有多个文件）应该保存在哪个文件夹。该地址应该指向一个空文件夹，若不存在，则会自动创建一个文件夹。

其二是 analysing_dir_path，用来存储分析过程中的中间状态。在扫描和分析成功后，这个文件夹及其内部文件将变得没用（你可以用代码将它们删除）。该地址应该指向一个文件夹，若不存在，则会自动创建一个文件夹。这个文件夹（及其内部文件）可以保存分析进度。若某次分析因为意外而中断，可以通过将 analysing_dir_path 配置到上次被中断而产生的 analysing 文件夹，从而从上次被中断的点恢复并继续分析。特别的，如果你要开始一个全新的任务，请手动删除或清空 analysing_dir_path 文件夹，避免误触发中断恢复功能。

在分析结束后，将 output_dir_path 文件夹地址传给如下代码作为参数，即可最终生成 EPUB 文件。

该步骤会根据之前分析的书本结构，在 EPUB 中分章节，并匹配恰当的目录结构。此外，原本书页底部的注释和引用将以合适的方式呈现在 EPUB 中。

项目链接

地址（中文）：https://github.com/oomol-lab/pdf-craft/blob/main/README_zh-CN.md

2025年3月30日
Reve Image – 新的免费 AI 文生图，图生图，AI图像修改渲染新模型项目
Reve Image ：一个经过彻底训练的新模型，支持自然语言修改生成的图片，还支持拖入图片，再继续修改更新完善，通过AI能够精确对图片进行文字渲染！可以说是AI 文生图的新进王者。

A new model trained from the ground up to excel at prompt adherence, aesthetics, and typography

而网站名字的由来是：Reve Reve，法语中“梦想”的意思。Rev 。迭代。改进。集思广益。提高速度。

目前Reve Image 为登录用户提供每日20张免费图片生成。（Daily free images：Each day, you get 20 free images that are used before credits）

REVE简介

Reve AI, Inc. 是一家位于加利福尼亚州帕洛阿尔托的创意工具初创公司。一个由充满热情的研究人员、建造者、设计师和有远大理想的故事讲述者组成的小团队。

第一个版本是 Reve Image，经过彻底的训练，能够迅速遵守，美学，和图形设计和环境背景中的排版文本。. 敬请期待未来版本来自 Reve。

网站截图

操作说明
- 打开网站后，选择登录。
- 之后就可以进行文生图，图生图，填写要生成或者处理的图片描述。
- 选择比例，生成图片的数量，是否增强显示。如果你又合适的种子ID，也可以输入来限制图像生成。
- 之后点击向上的箭头就可以快速生成AI图像
网站链接

https://reve.art
2025年3月29日
Image Describer X：用 AI技术理解您的图片
Image Describer X使用先进AI技术将任何图片转化为详细、准确的描述。支持图像分类、标签生成、情绪分析、故事生成等功能，为内容创作提供辅助。是您提升工作效率的得力助手。

网站截图

网站特色
- 精确描述
我们的AI提供详细的、富有上下文的描述，捕捉图片中的每个重要细节。
- 闪电速度
通过高性能AI处理系统，即时获取图片描述。
- 多语言支持
生成多语言图片描述，触达全球受众。
- 自定义模版
提供不同应用场景的描述模板（如电商产品、社交媒体、教育材料等）

功能特性

物体检测

准确识别和描述图像中的物体、人物和元素。

场景理解

理解并详细描述复杂场景和活动。

文字识别

提取并描述图像中的文字内容。

情感分析

检测并描述图像中的情感和氛围。如“温馨”“震撼”“欢乐”

文案推荐

结合描述，自动生成适合营销、电商推广的文案内容，提升使用价值。

可视化分析

提供图像热点分析（如物体识别框），帮助用户理解AI生成描述的逻辑来源

网站链接

官网地址：https://image-describer.com/zh
2025年3月27日
星流 AI：生图神器，新一代的AI创作神器

星流AI，设计师的 AI 创意伙伴。这款生图神器以强大功能，助力设计师轻松突破创作瓶颈。一键操作即可开启超逼真绘画之旅，丰富多样的图像生成能力，结合便捷的操作界面，让设计工作高效且充满无限可能，重塑设计生产力

之前阿喵我分享过liblibAI，师出同门

网站截图

网站地址

星流官网：https://www.xingliu.art/

2025年3月26日
Ai Image BG：一个AI驱动的用于创建、增强和移除图像的网站

Ai Image BG ：AI 图像处理工具，主要有三个功能，一个是文生图绘画功能，质量还可以，另一个是背景移除，也就是抠图功能，最后一个是增强修复，包括老照片修复和黑白照片上色等，目前无限生成，完全免费，无需注册。

用AI图像技术为您的视觉内容赋能

网站截图

网站特色

我们的AI图像处理工具提供专业级服务，帮您创造令人惊艳的视觉内容，满足各种场景需求。

智能背景增强与修复

使用我们的AI技术增强照片背景、修复旧图像、为黑白照片上色，让每张图片焕发新生。先进算法确保处理效果自然、细节丰富。

AI艺术创作引擎

通过简单的文字描述生成精美艺术作品，支持多种风格，包括写实、动漫、绘画、素描和3D渲染。无需专业技能，即可创造专业视觉效果。

一键背景处理

智能识别并一键移除图像背景，支持透明背景、纯色背景和模糊背景等多种输出选项，完美适用于电商产品图、人物照片和设计素材。

简易直观的操作界面

简洁友好的用户界面设计，无需专业技能，只需上传图片、选择功能，即可获得专业级处理效果，大幅提升工作效率。

企业级图像解决方案

为各行业提供定制化图像处理解决方案，支持电子商务、市场营销、社交媒体和内容创作等多种应用场景，满足企业特定需求。

全平台无缝体验

完美适配PC、平板和移动设备，随时随地处理您的图像，支持云端存储和同步，确保创作流程不受设备限制。

网站链接

https://aiimagebg.com/zh

2025年3月25日
豆包爱学（原河马爱学）- AI学习好助手

河马爱学是一款在线学习产品，借助自适应智能学习系统，赋能老师教学、激发学生的自主学习能力

如果遇到不会的题目直接扫一下，然后会有一对一的讲解，它的讲解是引导式的，不是一次性将答案告诉你，所以我觉得很好。关键还免费。解决了不会题目的尴尬。跟作业帮类似，目前免费

软件截图

软件下载

官网：https://www.hippolearning.cn/

下载：各大应用商店搜索 豆包爱学

2025年3月25日
汉语新解，最近这个由人工智能模型生成注释，将一个汉语词汇进行全新角度解释的网站火了。
阿喵前言

这两天有个AI 网站火了，汉语新解，输入一个词汇，就能看到AI生成的注解。有点‘世说新语’的味道

将一个汉语词汇进行全新角度的解释，生成的注解卡片，带拼音，带英语翻译，日语翻译。下方是AI解释。还支持下载卡片。十分有趣

网站截图

网站使用

打开网站，在输入框内填写汉语词汇，点击黑框一针见血，就会调用AI解释词汇，扎针中。等生成完，就会在屏幕中间生成一个卡片，带拼音，带英语翻译，日语翻译。

原理出处
- ;; 作者: 李继刚
- ;; 版本: 0.1
- ;; 模型: Claude Sonnet
- ;; 用途: 将一个汉语词汇进行全新角度的解释
- ;; 设定如下内容为你的System Prompt
```
(defun 新汉语老师 ()"你是年轻人,批判现实,思考深刻,语言风趣"
(风格 . ("Oscar Wilde" "鲁迅" "林语堂") )
(擅长 . 一针见血)
(表达 . 隐喻)
(批判 . 讽刺幽默))
```
注意事项

网站注解，一针见血的使用有次数限制，当前浏览器可以免费使用三次。要想使用就得注册bigmodel。或者换设备操作，阿喵我试了无痕模式和切换其他浏览器都不行。甚至虚拟及里的浏览器都会提示达到使用次数，估计是记录ip之类的校验使用次数。

❗内容由人工智能模型生成，不代表平台观点，立场或态度，请合理友善的使用生成内容

如果你发一些敏感词，会弹窗提示，你不要命了啊，大哥别搞！

网站链接

https://hanyuxinjie.com
2024年9月13日
抖音语音生成器：文字转语音工具，AI配音神器，支持多种语言和语音
阿喵前言

现在看很多短视频的配音都是用的配音工具生成的，但是当你去找配音工具的时候，99%的视频或者文章都是教你去用那些国内开发的付费配音工具。要么声音刻板，要么需要看广告或者充会员。难道除了微软的那个免费TTS外就没有一个可以免费好用的配音工具了吗？答案当时有，今天阿喵给大家分享一个支持多语言，角色丰富免费免登录的在线文字转语音TTS工具

网站简介

TikTok语音生成器是一个多功能的在线文字转语音平台，它提供了包括jessie、C3PO、ghostface等在内的多种TikTok热门AI配音角色，支持中文、英语等多语言选项，每个角色都具有独特的声音特色。用户可以免费使用这个工具，无需注册，即可输入最多500字的文本，并选择不同的语言和角色来生成个性化的语音，非常适合视频编辑、内容创作或社交媒体分享。

提供多种语言和角色的AI配音选项，支持最多500字的文本输入，且无需注册即可使用。

截图

使用

在此输入一段文字例如：“阿喵好帅”此处可以选择你想要的语言（中|英）

这里可以选择你需要的角色配音，阿喵这里以小萝莉为例！！！

点击合成，等待2-3秒即可收听，还可保存下载。

特色
- 多语言支持：提供包括中文、英语、日语、韩语等在内的多种语言的AI配音。
- 角色丰富：每种语言下有多个角色可供选择，例如中文配音角色包括熊二、猴哥、小萝莉等。
- 热门TikTok语音：支持流行的TikTok语音，如jessie、C3PO、ghostface等。
- 免费易用：用户可以免费使用这个工具，无需注册账户，直接在网页上操作。
- 文本长度限制：允许用户输入最多500字的文本进行语音转换。
- 便捷操作：用户只需选择语言和角色，输入文本，点击合成，即可生成语音并播放或下载。
网站地址

使用地址：https://tiktokvoice.net/zh
2024年9月2日