# 本地大模型配置文件 models: qwen2_vl: name: "Qwen2.5-VL-72B-Instruct-AWQ" api_base: "http://10.192.72.12:9991/v1" api_key: "${YUSYS_MULTIMODAL_API_KEY}" model_id: "Qwen2.5-VL-72B-Instruct-AWQ" default_params: temperature: 0.1 max_tokens: 4096 timeout: 180 llava: name: "LLaVA-v1.6-34B" api_base: "http://localhost:11434/v1" api_key: "" model_id: "llava:34b" default_params: temperature: 0.1 max_tokens: 4096 timeout: 180 cogvlm: name: "CogVLM2-19B" api_base: "http://localhost:11434/v1" api_key: "" model_id: "cogvlm2:19b" default_params: temperature: 0.1 max_tokens: 4096 timeout: 180 # 提示词模板 prompts: photo_analysis: name: "照片分析" template: | 请仔细观察这张照片,分析以下内容: 1. 照片的拍摄环境和背景 2. 人物的外貌特征和着装 3. 照片的拍摄时间推测(基于服装、环境等) 4. 照片的保存状况(是否有破损、褪色等) 5. 照片的历史价值和意义 请用中文详细描述,分条列出分析结果。 ocr_standard: name: "标准OCR识别" template: | You are an AI assistant specialized in converting PDF images to Markdown format. Please follow these instructions for the conversion: 1. Text Processing: - Accurately recognize all text content in the PDF image without guessing or inferring. - Convert the recognized text into Markdown format. - Maintain the original document structure, including headings, paragraphs, lists, etc. - For financial amounts, use standard half-width characters (e.g., use "," for thousands separator and "." for decimal point) 2. Mathematical Formula Processing: - Convert all mathematical formulas to LaTeX format. - Enclose inline formulas with \( \). For example: This is an inline formula \( E = mc^2 \) - Enclose block formulas with \\[ \\]. For example: \[ \frac{-b \pm \sqrt{b^2 - 4ac}}{2a} \] 3. Table Processing: - Convert tables to HTML format. - Wrap the entire table with and
. - For financial data in tables, ensure numbers use standard format with half-width commas and periods 4. Figure Handling: - Ignore figures content in the PDF image. Do not attempt to describe or convert images. 5. Output Format: - Ensure the output Markdown document has a clear structure with appropriate line breaks between elements. - For complex layouts, try to maintain the original document's structure and format as closely as possible. - Use standard ASCII characters for punctuation and numbers Please strictly follow these guidelines to ensure accuracy and consistency in the conversion. table_extract: name: "表格提取" template: | 请从这张图片中提取所有表格数据,要求: 1. **表格识别**: - 准确识别所有表格边界 - 正确分辨表头和数据行 2. **数据提取**: - 逐行逐列提取所有数据 - 保持数据的原始格式和精度 - 特别注意数字、金额的准确性 3. **格式输出**: - 输出为HTML表格格式 - 保持表格的原始结构 - 使用标准的半角字符 4. **质量检查**: - 确保没有遗漏任何数据 - 验证数字格式的正确性 - 检查表格结构的完整性 photo_restore_classroom: name: "照片修复(教室背景)" template: | 请对这张老照片进行全面修复和背景替换,具体要求如下: **修复要求**: 1. 去除所有折痕、裂痕、污渍和划痕 2. 补全缺失的细节,提升清晰度 3. 人物面貌务必保持不变,只进行修复不改变特征 4. 进行适度的彩色化处理 **背景替换**: - 将现有的宿舍背景完全替换为教室场景 - 后方是黑板(深绿色或深灰色黑板) - 前方是课桌(木质课桌,呈棕色) - 营造1980-1990年代大学教室的氛围 - 保持照片的年代感和真实性 **色彩方案**: - 人物肤色:健康自然的亚洲人肤色 - 头发:自然黑色 - 服装色彩: * 左一:米色或卡其色外套,绿色裤子 * 左二:浅灰色工作服 * 左三:深蓝色毛衣 * 右一:深棕色或深绿色外套 - 教室环境: * 黑板:深绿色,略有粉笔痕迹 * 课桌:深棕色木质纹理 * 整体光线:自然的教室照明 **技术要求**: - 保持人物的相对位置和姿态不变 - 确保新背景与人物的光影一致 - 维持照片的复古质感和年代感 - 背景过渡要自然,避免生硬的拼接感 请生成修复后的照片。 photo_restore_advanced: name: "高级照片修复" template: | 作为专业的照片修复专家,请对这张珍贵的老照片进行全面修复: **第一步:损伤修复** - 识别并修复所有可见的折痕、裂痕、污渍 - 去除表面划痕和磨损痕迹 - 修复边缘破损和不平整部分 - 消除照片上的灰尘和水渍 **第二步:画质增强** - 提升整体清晰度和锐度 - 增强对比度和层次感 - 降噪处理,保持细节的同时减少颗粒感 - 色温校正,消除黄褐色偏色 **第三步:彩色化处理** 人物特征(从左到右): 1. 第一人:健康肤色,黑色头发,米色夹克,绿色裤子 2. 第二人:健康肤色,黑色头发,眼镜,浅色工作服 3. 第三人:健康肤色,黑色头发,深色毛衣 4. 第四人:健康肤色,黑色头发,深色外套 **第四步:背景重构** - 移除原有宿舍背景 - 替换为1980年代大学教室场景: * 后方:标准教室黑板(深绿色,有轻微粉笔使用痕迹) * 前方:传统木质课桌(深棕色,简约设计) * 侧面:教室墙面(浅色,符合当时建筑风格) * 照明:自然的教室光线,柔和均匀 **质量标准**: - 人物面部特征100%保持原貌 - 新背景与人物光影完美融合 - 色彩自然协调,符合年代特征 - 整体画面清晰,细节丰富 - 保持照片的历史真实感 请生成高质量的修复照片。 photo_colorize_classroom: name: "照片上色(教室版)" template: | 请为这张黑白老照片进行专业的彩色化处理,并调整背景: **彩色化标准**: 严格按照1980-1990年代中国大学生的真实色彩进行上色: 人物色彩: - 肤色:自然健康的东亚人肤色,偏暖但不过分红润 - 头发:统一为自然黑色,略带光泽 - 眼镜(第二人):深色镜框,透明镜片 服装色彩: - 左一:浅驼色或米色夹克,深绿色裤子 - 左二:浅灰蓝色工装,内搭白色或米色衬衫 - 左三:深蓝色或藏青色毛衣,下身深色裤子 - 右一:深棕色或军绿色外套 **背景改造**: 原背景(宿舍)→ 新背景(教室) - 后墙:标准教室黑板,深绿色,表面有自然的使用痕迹 - 前景:木质课桌,深棕色,简洁的1980年代设计风格 - 环境光:教室的自然照明,明亮但柔和 - 整体氛围:营造温馨的校园学习环境 **技术要求**: 1. 保持原有构图和人物姿态 2. 确保色彩过渡自然,无明显色块 3. 背景替换要无缝融合 4. 保持照片的年代质感 5. 色彩饱和度适中,避免过于鲜艳 请生成彩色化且背景更新的照片。 simple_photo_fix: name: "简单照片修复" template: | 请帮我修复这张老照片: 1. 去除所有折痕、划痕、污渍 2. 提升清晰度和对比度 3. 进行彩色化处理(自然色彩) 4. 将背景改为教室场景:后面是黑板,前面是课桌 5. 保持人物面貌不变,只做修复和美化 6. 整体风格要符合1980年代大学生活 请生成修复后的彩色照片。 # 默认配置 default: model: "qwen2_vl" prompt: "photo_analysis" normalize_numbers: false