博客

  • 猎犬:Windows 本地全文搜索工具,多语言OCR识别

    电脑使用了很多肯定存储了很多文件,有时候不记得文件具体存储位置了。那么有个本地全文搜索工具就很有必要了。

    软件介绍

    猎犬,一个Windows 本地全文搜索工具,快速、友好的桌面文本搜索软件。无需索引,支持文件文本提取,支持PDF、DOCX、ZIP、JPG 等30+文件格式,支持20+语言图片文字提取,界面简洁,操作方便,搜索结果一键导出为doc格式,保留文件路径、匹配内容等元数据,推荐。

    软件截图

    下载链接

    https://www.gewu.dev

  • 萤数:社交里程碑小助手,在线创建精美的社交媒体里程碑动画

    在做社交媒体时,粉丝增长到一个特定的里程碑是值得开心和庆祝的时刻。仅仅用文字来表达这一成就往往显得单调而缺乏创意。萤数的出现,为社交媒体用户带来了一种全新的庆祝方式,将粉丝增长的里程碑变成了一场视觉盛宴。

    网站介绍

    萤数,是一款由 hellokaton 精心打造的社交里程碑动画生成工具。用户只需输入自己的社交平台昵称、用户 ID、头像地址、关注者数量以及一段简短的 Follower 文案,就可以迅速生成一个精美的动画。这个动画生动地展示了粉丝数量的增长过程,为社交媒体上的里程碑时刻增添了独特的仪式感。

    网站截图

    特色

    • 自定义动画速度:提供匀速、渐进和弹性三种动画速度选项,用户可以根据自己的喜好选择最适合的动画模式,让粉丝增长的动画效果更加个性化。
    • 个性化展示:用户可以自由填写社交平台信息,包括昵称、ID、头像和 Follower 文案,使得生成的动画能够精准地反映个人或品牌的社交身份和成就。
    • 视觉吸引力:通过动画效果将粉丝增长的数字变化生动地展现出来,为观众带来视觉上的享受,让里程碑的庆祝更加引人注目。

    网站链接

    https://yingshu.hellokaton.me

  • Video2WebP:在线将视频转换为动画 WebP的小工具

    WebP是一种图片格式,由Google开发,旨在为网络提供高效的无损和有损压缩,可以显著减少图片文件的大小,同时保持较好的图像质量. 把多个图片帧串联起来,就构成了动画WebP。

    动画WebP具有动画效果的WebP图片格式,结合了WebP图片格式的优势,例如高压缩率和高质量,并增加了动画能力,类似于GIF动图,但体积更小,加载速度更快。

    网站介绍

    Video2WebP,在线将视频转换为动画 WebP的工具,可自定义帧率(1–30)、质量(1–100)和宽度比例(1–100%),视频越大等待转换时间越长,完成后可直接右键保存,完全浏览器本地运行,无需担心隐私问题,免费无广告,无需注册。推荐!

    网站截图

    使用方法

    1. 在支持的 Web 浏览器(如 Firefox、Chrome 或 Edge)上打开此页面(需要支持 SharedArrayBuffer 的浏览器)。
    2. 选择要转换为动画 WebP 的视频。
    3. 使用控件指定输出设置。更高的质量/大小/FPS 意味着更大的图像尺寸和更长的转换时间。
    4. 点击 转化率 按钮开始该过程。
    5. 请耐心等待。如果输入视频很大,此工具可能会很慢。
    6. 图像显示在下面后,您可以通过右键单击并保存图像来保存它。

    网站链接

    网站:https://video2webp.mattj.io/

    项目:https://github.com/devadvance/video2webp

  • Quick Prompt :浏览器扩展,提示词管理与快速输入工具

    浏览器扩展介绍

    Quick Prompt,是一款功能强大的浏览器扩展,专注于提示词管理与快速输入。它可以帮助您创建、管理和组织提示词库,并在任何网页的输入框中快速插入预设的Prompt内容,大幅提高您与AI工具交互的效率。

    截图

    核心功能

    • 📚 便捷提示词管理:轻松创建、编辑和管理您的提示词库
    • ⚡ 快速输入:在任何网页输入框中通过输入 /p 快速触发提示词选择器
    • 🎯 多种快捷操作: ⌨️ 使用快捷键(Ctrl+Shift+P / Command+Shift+P)打开提示词选择器
    • 💾 使用快捷键(Ctrl+Shift+S / Command+Shift+S)快速保存选中文本为提示词
    • 🖱️ 右键菜单直接保存选中文本为提示词
    • 🔧 自定义提示词:为每个提示词设置标题、内容和标签,方便分类和搜索
    • 💼 数据备份:支持提示词库的导出和导入,轻松跨设备迁移和备份
    • 🔍 智能搜索:快速搜索和过滤提示词功能
    • 🌓 自适应主题:自动适应系统的明暗主题

    使用场景

    • 🤖 AI助手交互:快速输入常用的AI提示词,提高交流效率
    • 📋 文本编辑:保存常用的文本模板,随时调用
    • 💡 内容创作:整理和管理创意提示,随时激发灵感
    • ⏱️ 工作效率:为重复性文本输入创建模板,节省时间

    简单易用

    • ⚡ 在任何输入框中输入 /p 触发选择器
    • 🔑 使用快捷键快速调用功能
    • 📥 通过右键菜单轻松保存喜欢的提示词
    • 📤 导入导出功能确保您的提示词库安全无忧

    下载链接

    Chrome 应用商店https://chromewebstore.google.com/detail/quick-prompt/hnjamiaoicaepbkhdoknhhcedjdocpkd

    项目地址:https://github.com/wenyuanw/quick-prompt

  • CloudPlayPlus:云玩加,开源免费远程串流软件,随时随地从任何设备上掌控自己的电脑

    虚拟键鼠和手柄,接近原生操作系统的键鼠体验,支持XBOX协议手柄,支持windows,macos,Andoird,ios以及网页版。

    CloudPlayPlus,一款远程桌面与游戏串流软件,可以从任何设备上掌控自己的电脑,办公,畅玩3A。源码已开源,完全免费,极低的延迟,在稳定的网络下远程桌面和使用自己电脑无异,可设置双重验证,避免未授权的连接;WebRTC提供信道加密,数据安全有保障。

    软件截图

    软件链接

    下载地址:https://www.cloudplayplus.com/#download

    网页地址:https://www.cloudplayplus.com/web/

  • Duckfolio:简洁、现代、有趣的个人主页模板

    阿喵介绍了很多个人主页模板,这个是阿喵最近看到最现代,最有趣的个人主页模板。

    Duckfolio旨在为开发者、设计师或创作者提供一个清爽、易于维护的在线名片,快速展示你的个人信息、社交链接与博客等内容。

    同时也展示了如何使用现代 Web 技术(Next.js、TailwindCSS、Shadcn UI 等)构建轻量级的静态网站。

    项目截图

    项目特色

    • 结构清晰,易于维护和定制
    • 使用 Next.js 15 + Turbopack,极速开发体验
    • 采用 Tailwind CSS 4 实现原子化、响应式布局
    • 支持 深色/浅色主题自动切换
    • 利用 Framer Motion 增添自然平滑的过渡动画
    • 使用 Shadcn UI 构建现代交互组件
    • 通过 Zustand 管理全局状态(如主题)
    • 完全响应式,适配移动端和大屏设备

    项目链接

    项目:https://github.com/Yorlg/Duckfolio

    展示:https://yorlg.it/

  • 深度图床:免费高速图床,多IP节点、简单、稳定、一站式图片存储与分享平台

    网站介绍

    深度图床,一个免费且高速的上传和分享图片的平台。适用于个人、博主、开发者等需要快速分享和管理图片的用户。不过需要注意的是,这个平台可能还处于起步阶段,图床目前托管 39 张图片,共占用储存 17.17 MB,因为托管的图片数量较少。用户在使用之前,可以先了解更多详细信息,确保该平台符合自己的需求。

    网站截图

    特色

    免费使用:无需付费,用户可以免费上传和分享图片。
    高速上传:利用多IP节点技术,确保图片上传和访问速度快捷。
    无损转换:用户可以快速将图像转换为URL链接,且不压缩图像质量。
    稳定可靠:提供稳定的服务,确保图片安全和持久的访问。
    相册加密访问:支持相册加密功能,保护用户隐私和图片安全。

    网站链接

    https://www.deepsook.cn

  • AI Song Maker:在线AI歌曲生成器,享受创作免版税音乐的乐趣

    内容创作者,当发送视频或者文字需要配音的时候,经常苦于音乐版权问题,甚至在不知情的情况下使用的有版权的音乐,造成内容违规。阿喵想着那可以试试自己创造音乐啦!

    AI Song Maker,一个在线AI音乐生成器,可以选择文本转歌曲和歌词转歌曲,选择音乐风格,说唱、摇滚、流行等,点击生成音乐即可。

    网站截图

    操作步骤

    步骤1: 选择音乐类型

    首先选择是要从文本生成歌曲还是从歌词生成歌曲,或选择纯音乐曲目。我们的AI音乐生成器会适应您的创作需求。

    步骤2: 添加风格和标题

    探索说唱、摇滚、流行等不同风格,或自定义男/女声和节奏。然后添加独特的标题来个性化您的歌曲并使其脱颖而出。

    步骤3: 生成您的歌曲

    使用AI音乐生成生成您的音乐,然后立即下载免版税音乐或通过平台与您的听众分享。

    网站链接

    https://www.aisongmaker.io/zh

  • TaleStreamAI :AI 小说推文到视频的自动化工作流程

    之前有AI工具支持写小说,现在的AI工具不仅可以写小说,还能提取小说片段生成视频。

    软件介绍

    TaleStreamAI,专注于自动化将 AI 生成的小说片段转化为引人入胜的视频内容以进行社交媒体分享的过程。工作流程无缝集成了最新的 AI 技术,以视觉上引人入胜的格式使虚构故事栩栩如生。推荐!

    项目使用到的大模型

    • DeepSeek-V3
    • gemini-2.0-flash
    • 硅基智能-FunAudioLLM/CosyVoice2-0.5B
    • 秋葉 aaaki forge 整合包

    项目截图

    项目特征

    全自动工作流程: TaleStreamAI 通过利用 AI 算法简化整个过程,消除了创建视频内容所涉及的体力劳动。

    AI 小说推文提取:系统自动提取 AI 模型生成的小说推文,作为视频内容的基础。

    视频创作: 利用 AI 的力量,TaleStreamAI 将新颖的片段转换为具有视觉吸引力的视频,以便在各种社交媒体平台上分享。

    效率和创新:通过将 AI 功能与讲故事相结合,TaleStreamAI 突破了内容创建和分发的界限。
    项目流程

    流程说明

    文件名功能模型/库
    main.py获取书籍内容
    board.py生成章节分镜gemini-2.0-flash
    prompt.py润色分镜提示词deepseek-v3
    image.py生成图片秋葉 aaaki forge 版
    audio.py生成音频CosyVoice2-0.5B:benjamin
    tts.py生成字幕本地运行 whisper
    video.py生成视频ffmpeg-gpu 加速版
    video_end.py生成完整视频ffmpeg-gpu 加速版

    本地运行

    本项目使用的是uv来管理依赖,建议 python 版本>=3.10

    1. 安装uv
    pip install uv
    1. 创建虚拟环境
    uv venv --python 3.12
        .\.venv\Scripts\activate
    1. 安装包
    uv add -r requirements.txt
    1. 安装 torch 环境torch 环境请根据你系统的 cuda 版本来安装 torch 官网
    uv pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

    可以通过nvidia-smi来查询你的显卡支持的最高cuda版本

    nvidia-smi
    +-----------------------------------------------------------------------------------------+
    | NVIDIA-SMI 560.94                 Driver Version: 560.94         CUDA Version: 12.6     |
    |-----------------------------------------+------------------------+----------------------+
    | GPU  Name                  Driver-Model | Bus-Id          Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
    |                                         |                        |               MIG M. |
    |=========================================+========================+======================|
    |   0  NVIDIA GeForce RTX 4070 Ti   WDDM  |   00000000:01:00.0  On |                  N/A |
    |  0%   28C    P8              4W /  285W |    2157MiB /  12282MiB |      2%      Default |
    |                                         |                        |                  N/A |
    +-----------------------------------------+------------------------+----------------------+

    通过 nvcc 来查询你电脑已安装的cuda版本

    其实是你环境变量中配置的版本而已,一个电脑上可以安装多个 cuda

    nvcc: NVIDIA (R) Cuda compiler driver
    Copyright (c) 2005-2022 NVIDIA Corporation
    Built on Wed_Sep_21_10:41:10_Pacific_Daylight_Time_2022
    Cuda compilation tools, release 11.8, V11.8.89
    Build cuda_11.8.r11.8/compiler.31833905_0

    环境配置

    复制 .env.example 文件,改名为 .env
    配置其缺少的 APIKey
    其中 AUDIO_API_KEY 是可以支持多 Key 轮询的,用,分割
    (做到这一步我才意识到可以多 Key 支持高并发 😂 如果需 Gemini 需要高并发的话,可能需要手动去 copy 多 key 的处理的代码到board.py中了)
    配置起点达人中心的 Cookie 用来抓取小说 起点达人中心
    安装ffmpeg最好安装GPU加速版,否则生成的很慢(好像新一点的版本都已经支持gpu加速了) Github
    使用 ffmpeg -hwaccels 来列出硬件加速选项

    Hardware acceleration methods:
    cuda
    vaapi
    dxva2
    qsv
    d3d11va
    opencl
    vulkan

    运行项目

    我是直接按照项目流程来逐个运行文件的

    uv run app/main.py     # 获取小说内容
    uv run board.py    # 生成分镜
    uv run prompt.py   # 优化提示词
    uv run image.py    # 生成图片
    uv run audio.py    # 合成音频  
    uv run tts.py      # 生成字幕
    uv run video.py    # 制作分镜视频
    uv run video_end.py # 最终合成

    如果你想要直接运行 也可以直接运行 main.py

    uv run main.py

    Whisper 模型规格概览

    Whisper 模型规格

    模型规格参数量最低显存要求
    Tiny39M~1GB
    Base74M~1GB
    Small244M~2GB
    Medium769M~5GB
    Large1550M~10GB
    Large-v21550M~10GB
    Large-v31550M~10GB
    1. 运行示例代码 可以先写个测试,运行示例代码来下载 Whisper
    import torch
    from transformers import WhisperProcessor, WhisperForConditionalGeneration

    # 选择适合您显存的模型大小,例如"medium"
    model_id = "openai/whisper-medium"

    # 启用半精度以节省显存
    processor = WhisperProcessor.from_pretrained(model_id)
    model = WhisperForConditionalGeneration.from_pretrained(
    model_id,
    torch_dtype=torch.float16,
    device_map="auto"
    )

    # 确保模型在GPU上运行
    device = "cuda" if torch.cuda.is_available() else "cpu"
    model = model.to(device)

    下载地址

    https://github.com/zqq-nuli/TaleStreamAI

    成片演示:https://www.bilibili.com/video/BV1mmQvYEEwb/

  • ChatCopilot:获取微信聊天记录,并实时存储到数据库的工具,适用于MacOS

    网站介绍

    ChatCopilot 是一款用 golang 实现的获取微信聊天记录并支持实时存储到数据库的工具,目前只支持在 MacOS 上可运行。

    截图

    当前实现功能

    1. 群聊
    • 通过群昵称获取群聊基本信息
    • 将群聊历史记录保存至 mysql
    • 实时更新接收到的群聊消息
    1. 联系人聊天
    • 通过昵称获取联系人基本信息
    • 将聊天历史记录保存至 mysql
    • 实时更新接收到的聊天消息

    3.消息处理

    • 语音:解码语音消息转为 wav 格式
    • 图片:明文显示图片说在路径
    • 视频:明文显示视频说在路径
    • 表情包:保存表情包图片到本地

    项目链接

    https://github.com/lw396/ChatCopilot