# 本地大模型配置文件
models:
qwen2_vl:
name: "Qwen2.5-VL-72B-Instruct-AWQ"
api_base: "http://10.192.72.12:9991/v1"
api_key: "${YUSYS_MULTIMODAL_API_KEY}"
model_id: "Qwen2.5-VL-72B-Instruct-AWQ"
default_params:
temperature: 0.1
max_tokens: 4096
timeout: 180
llava:
name: "LLaVA-v1.6-34B"
api_base: "http://localhost:11434/v1"
api_key: ""
model_id: "llava:34b"
default_params:
temperature: 0.1
max_tokens: 4096
timeout: 180
cogvlm:
name: "CogVLM2-19B"
api_base: "http://localhost:11434/v1"
api_key: ""
model_id: "cogvlm2:19b"
default_params:
temperature: 0.1
max_tokens: 4096
timeout: 180
# 提示词模板
prompts:
photo_analysis:
name: "照片分析"
template: |
请仔细观察这张照片,分析以下内容:
1. 照片的拍摄环境和背景
2. 人物的外貌特征和着装
3. 照片的拍摄时间推测(基于服装、环境等)
4. 照片的保存状况(是否有破损、褪色等)
5. 照片的历史价值和意义
请用中文详细描述,分条列出分析结果。
ocr_standard:
name: "标准OCR识别"
template: |
You are an AI assistant specialized in converting PDF images to Markdown format. Please follow these instructions for the conversion:
1. Text Processing:
- Accurately recognize all text content in the PDF image without guessing or inferring.
- Convert the recognized text into Markdown format.
- Maintain the original document structure, including headings, paragraphs, lists, etc.
- For financial amounts, use standard half-width characters (e.g., use "," for thousands separator and "." for decimal point)
2. Mathematical Formula Processing:
- Convert all mathematical formulas to LaTeX format.
- Enclose inline formulas with \( \). For example: This is an inline formula \( E = mc^2 \)
- Enclose block formulas with \\[ \\]. For example: \[ \frac{-b \pm \sqrt{b^2 - 4ac}}{2a} \]
3. Table Processing:
- Convert tables to HTML format.
- Wrap the entire table with
.
- For financial data in tables, ensure numbers use standard format with half-width commas and periods
4. Figure Handling:
- Ignore figures content in the PDF image. Do not attempt to describe or convert images.
5. Output Format:
- Ensure the output Markdown document has a clear structure with appropriate line breaks between elements.
- For complex layouts, try to maintain the original document's structure and format as closely as possible.
- Use standard ASCII characters for punctuation and numbers
Please strictly follow these guidelines to ensure accuracy and consistency in the conversion.
table_extract:
name: "表格提取"
template: |
请从这张图片中提取所有表格数据,要求:
1. **表格识别**:
- 准确识别所有表格边界
- 正确分辨表头和数据行
2. **数据提取**:
- 逐行逐列提取所有数据
- 保持数据的原始格式和精度
- 特别注意数字、金额的准确性
3. **格式输出**:
- 输出为HTML表格格式
- 保持表格的原始结构
- 使用标准的半角字符
4. **质量检查**:
- 确保没有遗漏任何数据
- 验证数字格式的正确性
- 检查表格结构的完整性
photo_restore_classroom:
name: "照片修复(教室背景)"
template: |
请对这张老照片进行全面修复和背景替换,具体要求如下:
**修复要求**:
1. 去除所有折痕、裂痕、污渍和划痕
2. 补全缺失的细节,提升清晰度
3. 人物面貌务必保持不变,只进行修复不改变特征
4. 进行适度的彩色化处理
**背景替换**:
- 将现有的宿舍背景完全替换为教室场景
- 后方是黑板(深绿色或深灰色黑板)
- 前方是课桌(木质课桌,呈棕色)
- 营造1980-1990年代大学教室的氛围
- 保持照片的年代感和真实性
**色彩方案**:
- 人物肤色:健康自然的亚洲人肤色
- 头发:自然黑色
- 服装色彩:
* 左一:米色或卡其色外套,绿色裤子
* 左二:浅灰色工作服
* 左三:深蓝色毛衣
* 右一:深棕色或深绿色外套
- 教室环境:
* 黑板:深绿色,略有粉笔痕迹
* 课桌:深棕色木质纹理
* 整体光线:自然的教室照明
**技术要求**:
- 保持人物的相对位置和姿态不变
- 确保新背景与人物的光影一致
- 维持照片的复古质感和年代感
- 背景过渡要自然,避免生硬的拼接感
请生成修复后的照片。
photo_restore_advanced:
name: "高级照片修复"
template: |
作为专业的照片修复专家,请对这张珍贵的老照片进行全面修复:
**第一步:损伤修复**
- 识别并修复所有可见的折痕、裂痕、污渍
- 去除表面划痕和磨损痕迹
- 修复边缘破损和不平整部分
- 消除照片上的灰尘和水渍
**第二步:画质增强**
- 提升整体清晰度和锐度
- 增强对比度和层次感
- 降噪处理,保持细节的同时减少颗粒感
- 色温校正,消除黄褐色偏色
**第三步:彩色化处理**
人物特征(从左到右):
1. 第一人:健康肤色,黑色头发,米色夹克,绿色裤子
2. 第二人:健康肤色,黑色头发,眼镜,浅色工作服
3. 第三人:健康肤色,黑色头发,深色毛衣
4. 第四人:健康肤色,黑色头发,深色外套
**第四步:背景重构**
- 移除原有宿舍背景
- 替换为1980年代大学教室场景:
* 后方:标准教室黑板(深绿色,有轻微粉笔使用痕迹)
* 前方:传统木质课桌(深棕色,简约设计)
* 侧面:教室墙面(浅色,符合当时建筑风格)
* 照明:自然的教室光线,柔和均匀
**质量标准**:
- 人物面部特征100%保持原貌
- 新背景与人物光影完美融合
- 色彩自然协调,符合年代特征
- 整体画面清晰,细节丰富
- 保持照片的历史真实感
请生成高质量的修复照片。
photo_colorize_classroom:
name: "照片上色(教室版)"
template: |
请为这张黑白老照片进行专业的彩色化处理,并调整背景:
**彩色化标准**:
严格按照1980-1990年代中国大学生的真实色彩进行上色:
人物色彩:
- 肤色:自然健康的东亚人肤色,偏暖但不过分红润
- 头发:统一为自然黑色,略带光泽
- 眼镜(第二人):深色镜框,透明镜片
服装色彩:
- 左一:浅驼色或米色夹克,深绿色裤子
- 左二:浅灰蓝色工装,内搭白色或米色衬衫
- 左三:深蓝色或藏青色毛衣,下身深色裤子
- 右一:深棕色或军绿色外套
**背景改造**:
原背景(宿舍)→ 新背景(教室)
- 后墙:标准教室黑板,深绿色,表面有自然的使用痕迹
- 前景:木质课桌,深棕色,简洁的1980年代设计风格
- 环境光:教室的自然照明,明亮但柔和
- 整体氛围:营造温馨的校园学习环境
**技术要求**:
1. 保持原有构图和人物姿态
2. 确保色彩过渡自然,无明显色块
3. 背景替换要无缝融合
4. 保持照片的年代质感
5. 色彩饱和度适中,避免过于鲜艳
请生成彩色化且背景更新的照片。
simple_photo_fix:
name: "简单照片修复"
template: |
请帮我修复这张老照片:
1. 去除所有折痕、划痕、污渍
2. 提升清晰度和对比度
3. 进行彩色化处理(自然色彩)
4. 将背景改为教室场景:后面是黑板,前面是课桌
5. 保持人物面貌不变,只做修复和美化
6. 整体风格要符合1980年代大学生活
请生成修复后的彩色照片。
# 默认配置
default:
model: "qwen2_vl"
prompt: "photo_analysis"
normalize_numbers: false