标签: deepseek

  • DeepSeek OCR APP- 由 DeepSeek-OCR 提供支持的 OCR Web 前端OCR程序,直接在线识别各种图像

    模型介绍

    DeepSeek_OCR_APP,为DeepSeek-OCR 提供支持的 OCR Web 前端OCR程序,直接在线识别各种图像,需要自行部署。

    硬件:支持 CUDA 的 NVIDIA GPU,推荐:RTX 3090、RTX 4090、RTX 5090 或更高版本,最低要求:8-12GB VRAM(适用于该型号),更多的 VRAM 总是好的!

    模型截图

    All birds品种丰富色彩鲜艳,栖息在繁花似锦的春日树枝上,展现自然生态之美.
    2020年到2006年数据线性增长折线图.

    核心功能

    4 种核心 OCR 模式

    • 纯文本 OCR – 从任何图像中提取原始文本
    • 描述– 生成智能图像描述
    • 查找– 使用视觉边界框定位特定术语
    • 自由形式——针对特殊任务的自定义提示

    UI 功能

    🔍 多边界框支持(处理找到的术语的多个实例)

    🎨 具有动画渐变的玻璃形态设计

    🎯 拖放文件上传(默认最大 100MB)

    🗑️ 轻松删除图像并重新上传

    📦 具有适当坐标缩放的接地盒可视化

    ✨ 流畅的动画(Framer Motion)

    📋 复制/下载结果

    🎛️ 高级设置下拉菜单

    📝 HTML 和 Markdown 渲染以进行格式化输出

    快速配置

    1. 克隆并配置:git clone <repository-url> cd deepseek_ocr_app # Copy and customize environment variables cp .env.example .env # Edit .env to configure ports, upload limits, etc.
    2. 启动应用程序:docker compose up –build第一次运行将下载模型(~5-10GB),这可能需要一些时间。
    3. 访问应用程序:

    模型链接

    github:https://github.com/rdumasia303/deepseek_ocr_app

  • DeepSeek-V3-0324 发布,推理与代码能力全面升级

    DeepSeek-V3-0324 发布,推理与代码能力全面升级

    近日,DeepSeek AI 正式发布 DeepSeek-V3 模型的小版本升级——DeepSeek-V3-0324。新版本现已开放体验,用户可通过官方网页、App 和小程序关闭“深度思考”后使用,无需更改 API 接口和使用方式。

    详情

    推理任务能力大幅提升,超越 GPT-4.5
    DeepSeek-V3-0324 借鉴 DeepSeek-R1 在训练过程中使用的强化学习技术,在数学与代码相关任务的表现上实现显著提升。最新评测数据显示,在 MATH-500、AIME 2024、LiveCodeBench 等数据集上的表现超过 GPT-4.5,展现出更强的推理与代码生成能力。

    前端开发与中文写作能力增强
    在 HTML 和前端代码生成方面,DeepSeek-V3-0324 生成的代码可用性更高,视觉效果更加美观,富有设计感。同时,在中文写作任务上,新版本针对中长篇文本创作进行了优化,内容质量更上一层楼。

    搜索与工具调用优化,体验更加流畅
    新版 V3 模型在联网搜索场景下,对报告类任务的内容输出更加详实准确,排版更清晰。此外,工具调用、角色扮演、问答闲聊等多方面能力均有所提升,使对话体验更加流畅。

    开源与私有化部署支持
    DeepSeek-V3-0324 沿用 DeepSeek-V3 的 base 模型,仅优化后训练方法。私有化部署时,仅需更新 checkpoint 和 tokenizer_config.json,即可完成升级。模型参数规模约 660B,开源版本支持 128K 上下文长度(网页端、App 和 API 提供 64K)。

    链接

    模型现已开源,并遵循 MIT License,允许用户利用模型输出或蒸馏训练其他模型。权重下载地址如下: