第 11 章：DSPy 案例研究和应用场景

Haiyue2025/9/1大约 27 分钟

第 11 章：DSPy 案例研究和应用场景

学习目标

分析问答系统的DSPy实现
构建文本摘要和内容生成系统
实现代码生成和程序修复
设计对话系统和聊天机器人
探索多模态任务的处理方法

知识点

1. 智能问答系统案例

智能问答系统是DSPy的典型应用场景，展示了从简单到复杂的各种实现方式。

基础问答系统

import dspy
from typing import List, Dict, Any, Optional
import json
import re
from dataclasses import dataclass
from abc import ABC, abstractmethod

@dataclass
class Question:
    """问题数据结构"""
    id: str
    text: str
    category: Optional[str] = None
    difficulty: Optional[str] = None
    context: Optional[str] = None
    expected_answer: Optional[str] = None

@dataclass
class Answer:
    """答案数据结构"""
    question_id: str
    text: str
    confidence: float
    reasoning: str
    sources: List[str]
    is_accurate: Optional[bool] = None

class BaseQASystem(dspy.Module):
    """基础问答系统"""
    
    def __init__(self):
        super().__init__()
        
        # 问题分类器
        self.question_classifier = dspy.ChainOfThought(
            "question -> reasoning, category, difficulty",
            instructions="""分析问题并进行分类：
            1. 类别: 事实性、推理性、开放性、计算性
            2. 难度: 简单、中等、困难
            3. 提供分类的理由"""
        )
        
        # 答案生成器
        self.answer_generator = dspy.ChainOfThought(
            "question, category, context -> reasoning, answer, confidence",
            instructions="""基于问题和上下文生成准确的答案：
            1. 仔细分析问题的核心要求
            2. 如果有上下文，优先基于上下文回答
            3. 提供清晰的推理过程
            4. 评估答案的置信度(0-1)"""
        )
        
        # 答案验证器
        self.answer_validator = dspy.ChainOfThought(
            "question, answer, reasoning -> validation_reasoning, is_valid, suggestions",
            instructions="""验证答案的准确性和完整性：
            1. 检查答案是否直接回应了问题
            2. 验证推理过程是否合理
            3. 评估答案的准确性和完整性
            4. 如果不满意，提供改进建议"""
        )
    
    def forward(self, question: str, context: str = "") -> Answer:
        """处理问答请求"""
        
        # 1. 问题分类
        classification = self.question_classifier(question=question)
        
        # 2. 生成答案
        answer_result = self.answer_generator(
            question=question,
            category=classification.category,
            context=context
        )
        
        # 3. 验证答案
        validation = self.answer_validator(
            question=question,
            answer=answer_result.answer,
            reasoning=answer_result.reasoning
        )
        
        # 4. 构建答案对象
        answer = Answer(
            question_id="",
            text=answer_result.answer,
            confidence=float(answer_result.confidence) if answer_result.confidence else 0.5,
            reasoning=answer_result.reasoning,
            sources=[context] if context else [],
            is_accurate=validation.is_valid.lower() in ['true', 'valid', '是', '正确'] if hasattr(validation, 'is_valid') else None
        )
        
        return answer

class AdvancedQASystem(BaseQASystem):
    """高级问答系统，支持多种增强功能"""
    
    def __init__(self, enable_rag=True, enable_fact_checking=True):
        super().__init__()
        
        self.enable_rag = enable_rag
        self.enable_fact_checking = enable_fact_checking
        
        # RAG组件
        if enable_rag:
            self.knowledge_retriever = dspy.Retrieve(k=5)
            self.context_synthesizer = dspy.ChainOfThought(
                "question, retrieved_passages -> reasoning, synthesized_context",
                instructions="将检索到的相关段落合成为连贯的上下文信息。"
            )
        
        # 事实检查组件
        if enable_fact_checking:
            self.fact_checker = dspy.ChainOfThought(
                "statement, context -> reasoning, fact_check_result, confidence",
                instructions="""对陈述进行事实检查：
                1. 识别可验证的事实性声明
                2. 基于上下文验证这些声明
                3. 给出事实检查结果：正确、错误、无法验证
                4. 提供置信度评分"""
            )
    
    def forward(self, question: str, context: str = "") -> Answer:
        """高级问答处理"""
        
        # 1. 问题分类
        classification = self.question_classifier(question=question)
        
        # 2. 知识检索（如果启用RAG）
        enhanced_context = context
        retrieved_sources = []
        
        if self.enable_rag:
            try:
                retrieved_passages = self.knowledge_retriever(question)
                
                if retrieved_passages:
                    synthesis_result = self.context_synthesizer(
                        question=question,
                        retrieved_passages=str(retrieved_passages)
                    )
                    enhanced_context = synthesis_result.synthesized_context
                    retrieved_sources = ["knowledge_base"]
            except Exception as e:
                print(f"RAG检索失败: {e}")
        
        # 3. 生成答案
        answer_result = self.answer_generator(
            question=question,
            category=classification.category,
            context=enhanced_context
        )
        
        # 4. 事实检查（如果启用）
        fact_check_confidence = 1.0
        if self.enable_fact_checking and answer_result.answer:
            try:
                fact_check = self.fact_checker(
                    statement=answer_result.answer,
                    context=enhanced_context
                )
                
                if hasattr(fact_check, 'confidence'):
                    fact_check_confidence = float(fact_check.confidence)
                    
            except Exception as e:
                print(f"事实检查失败: {e}")
        
        # 5. 验证答案
        validation = self.answer_validator(
            question=question,
            answer=answer_result.answer,
            reasoning=answer_result.reasoning
        )
        
        # 6. 计算综合置信度
        base_confidence = float(answer_result.confidence) if answer_result.confidence else 0.5
        final_confidence = (base_confidence + fact_check_confidence) / 2
        
        # 7. 构建答案
        answer = Answer(
            question_id="",
            text=answer_result.answer,
            confidence=final_confidence,
            reasoning=answer_result.reasoning,
            sources=retrieved_sources + ([context] if context else []),
            is_accurate=validation.is_valid.lower() in ['true', 'valid', '是', '正确'] if hasattr(validation, 'is_valid') else None
        )
        
        return answer

# 专门领域的问答系统
class DomainSpecificQA(dspy.Module):
    """领域特定问答系统"""
    
    def __init__(self, domain: str, domain_knowledge: Dict[str, Any]):
        super().__init__()
        
        self.domain = domain
        self.domain_knowledge = domain_knowledge
        
        # 领域相关的组件
        self.domain_classifier = dspy.ChainOfThought(
            f"question -> reasoning, is_domain_relevant, subdomain",
            instructions=f"""判断问题是否与{domain}领域相关：
            1. 分析问题的主题和内容
            2. 判断是否属于{domain}领域
            3. 如果相关，识别具体的子领域"""
        )
        
        self.domain_expert = dspy.ChainOfThought(
            f"question, domain_context -> reasoning, expert_answer",
            instructions=f"""作为{domain}领域的专家回答问题：
            1. 使用领域专业知识
            2. 确保术语使用准确
            3. 提供专业且准确的答案
            4. 必要时解释专业概念"""
        )
        
        self.terminology_explainer = dspy.ChainOfThought(
            "technical_answer, domain -> reasoning, explained_answer",
            instructions=f"""解释{domain}领域的专业术语：
            1. 识别答案中的专业术语
            2. 提供通俗易懂的解释
            3. 保持专业性的同时增加可读性"""
        )
    
    def forward(self, question: str) -> Answer:
        """处理领域特定问题"""
        
        # 1. 领域相关性判断
        domain_check = self.domain_classifier(question=question)
        
        # 2. 准备领域上下文
        domain_context = self._prepare_domain_context(question)
        
        # 3. 专家回答
        expert_response = self.domain_expert(
            question=question,
            domain_context=domain_context
        )
        
        # 4. 术语解释
        explained_response = self.terminology_explainer(
            technical_answer=expert_response.expert_answer,
            domain=self.domain
        )
        
        # 5. 构建答案
        is_relevant = domain_check.is_domain_relevant.lower() in ['true', 'yes', '是', '相关']
        
        answer = Answer(
            question_id="",
            text=explained_response.explained_answer,
            confidence=0.9 if is_relevant else 0.6,
            reasoning=expert_response.reasoning,
            sources=[f"{self.domain}_knowledge_base"],
            is_accurate=None
        )
        
        return answer
    
    def _prepare_domain_context(self, question: str) -> str:
        """准备领域上下文"""
        
        # 从领域知识库中提取相关信息
        relevant_info = []
        
        question_lower = question.lower()
        
        for topic, info in self.domain_knowledge.items():
            if any(keyword in question_lower for keyword in topic.lower().split()):
                relevant_info.append(f"{topic}: {info}")
        
        return "\n".join(relevant_info) if relevant_info else f"这是关于{self.domain}领域的问题。"

# 使用示例
def demonstrate_qa_systems():
    """演示问答系统"""
    
    # 基础问答系统
    basic_qa = BaseQASystem()
    
    # 高级问答系统
    advanced_qa = AdvancedQASystem(enable_rag=False, enable_fact_checking=True)
    
    # 领域特定问答系统（医学）
    medical_knowledge = {
        "高血压": "一种常见的心血管疾病，血压持续高于正常值",
        "糖尿病": "一组以高血糖为特征的代谢性疾病",
        "心脏病": "影响心脏结构或功能的疾病"
    }
    
    medical_qa = DomainSpecificQA("医学", medical_knowledge)
    
    # 测试问题
    test_questions = [
        {
            "question": "什么是人工智能？",
            "context": "人工智能（AI）是计算机科学的一个分支，致力于创建能够执行通常需要人类智能的任务的系统。"
        },
        {
            "question": "高血压有什么症状？",
            "context": ""
        }
    ]
    
    print("🧠 问答系统演示")
    print("=" * 50)
    
    for i, test_case in enumerate(test_questions, 1):
        question = test_case["question"]
        context = test_case["context"]
        
        print(f"\n问题 {i}: {question}")
        
        # 基础问答
        print("\n📝 基础问答系统:")
        basic_answer = basic_qa(question, context)
        print(f"答案: {basic_answer.text}")
        print(f"置信度: {basic_answer.confidence:.2f}")
        
        # 高级问答
        print("\n🚀 高级问答系统:")
        advanced_answer = advanced_qa(question, context)
        print(f"答案: {advanced_answer.text}")
        print(f"置信度: {advanced_answer.confidence:.2f}")
        
        # 领域特定问答（仅医学问题）
        if "血压" in question or "糖尿病" in question or "心脏" in question:
            print("\n🏥 医学领域问答:")
            medical_answer = medical_qa(question)
            print(f"答案: {medical_answer.text}")
            print(f"置信度: {medical_answer.confidence:.2f}")
    
    return basic_qa, advanced_qa, medical_qa

# demo_qa_systems = demonstrate_qa_systems()

2. 文本摘要和内容生成系统

文本摘要和内容生成是另一个重要的应用领域。

class TextSummarizationSystem(dspy.Module):
    """文本摘要系统"""
    
    def __init__(self):
        super().__init__()
        
        # 文本分析器
        self.text_analyzer = dspy.ChainOfThought(
            "text -> reasoning, analysis",
            instructions="""分析文本的特征：
            1. 文本长度和结构
            2. 主要主题和关键点
            3. 文体和语调
            4. 摘要难度评估"""
        )
        
        # 关键信息提取器
        self.key_extractor = dspy.ChainOfThought(
            "text, analysis -> reasoning, key_points",
            instructions="""提取文本的关键信息：
            1. 识别核心论点和主要观点
            2. 提取重要的事实和数据
            3. 保留关键的论证逻辑
            4. 按重要性排序"""
        )
        
        # 摘要生成器
        self.summarizer = dspy.ChainOfThought(
            "text, key_points, target_length -> reasoning, summary",
            instructions="""生成高质量摘要：
            1. 保持原文的核心意思
            2. 使用简洁清晰的语言
            3. 保持逻辑连贯性
            4. 控制在目标长度内"""
        )
        
        # 摘要评估器
        self.summary_evaluator = dspy.ChainOfThought(
            "original_text, summary -> reasoning, quality_score, improvements",
            instructions="""评估摘要质量：
            1. 准确性：是否保持原文核心信息
            2. 完整性：是否涵盖主要观点
            3. 简洁性：是否消除冗余信息
            4. 可读性：是否表达清晰流畅
            给出0-10分的质量评分"""
        )
    
    def forward(self, text: str, target_length: int = 100) -> Dict[str, Any]:
        """生成文本摘要"""
        
        # 1. 文本分析
        analysis = self.text_analyzer(text=text)
        
        # 2. 提取关键信息
        key_extraction = self.key_extractor(
            text=text,
            analysis=analysis.analysis
        )
        
        # 3. 生成摘要
        summarization = self.summarizer(
            text=text,
            key_points=key_extraction.key_points,
            target_length=str(target_length)
        )
        
        # 4. 评估摘要
        evaluation = self.summary_evaluator(
            original_text=text,
            summary=summarization.summary
        )
        
        return {
            "original_text": text,
            "summary": summarization.summary,
            "key_points": key_extraction.key_points,
            "analysis": analysis.analysis,
            "quality_score": evaluation.quality_score,
            "reasoning": summarization.reasoning,
            "improvements": getattr(evaluation, 'improvements', '')
        }

class ContentGenerationSystem(dspy.Module):
    """内容生成系统"""
    
    def __init__(self):
        super().__init__()
        
        # 内容规划器
        self.content_planner = dspy.ChainOfThought(
            "topic, content_type, target_audience -> reasoning, content_plan",
            instructions="""制定内容创作计划：
            1. 分析主题的核心要点
            2. 确定内容结构和逻辑流程
            3. 考虑目标受众的需求和水平
            4. 规划内容的深度和广度"""
        )
        
        # 内容生成器
        self.content_generator = dspy.ChainOfThought(
            "topic, plan, style_requirements -> reasoning, content",
            instructions="""根据计划生成高质量内容：
            1. 遵循内容计划的结构
            2. 保持一致的写作风格
            3. 提供有价值的信息和洞察
            4. 确保内容的原创性和准确性"""
        )
        
        # 内容优化器
        self.content_optimizer = dspy.ChainOfThought(
            "original_content, optimization_goals -> reasoning, optimized_content",
            instructions="""优化内容质量：
            1. 改善语言表达和文字流畅度
            2. 增强逻辑结构和连贯性
            3. 调整语调以匹配目标受众
            4. 增加吸引力和可读性"""
        )
        
        # 内容评审器
        self.content_reviewer = dspy.ChainOfThought(
            "content, quality_criteria -> reasoning, review_result, score",
            instructions="""全面评审内容质量：
            1. 内容准确性和权威性
            2. 结构组织和逻辑性
            3. 语言表达和可读性
            4. 创新性和价值性
            给出详细反馈和1-10分评分"""
        )
    
    def generate_article(self, 
                        topic: str, 
                        content_type: str = "informative", 
                        target_audience: str = "general",
                        style_requirements: str = "professional") -> Dict[str, Any]:
        """生成文章"""
        
        # 1. 内容规划
        planning = self.content_planner(
            topic=topic,
            content_type=content_type,
            target_audience=target_audience
        )
        
        # 2. 初始内容生成
        generation = self.content_generator(
            topic=topic,
            plan=planning.content_plan,
            style_requirements=style_requirements
        )
        
        # 3. 内容优化
        optimization = self.content_optimizer(
            original_content=generation.content,
            optimization_goals=f"针对{target_audience}读者优化{content_type}类型的{topic}内容"
        )
        
        # 4. 内容评审
        review = self.content_reviewer(
            content=optimization.optimized_content,
            quality_criteria="准确性、可读性、结构性、创新性"
        )
        
        return {
            "topic": topic,
            "content_plan": planning.content_plan,
            "generated_content": optimization.optimized_content,
            "review_score": review.score,
            "review_feedback": review.review_result,
            "generation_reasoning": generation.reasoning,
            "optimization_reasoning": optimization.reasoning
        }
    
    def generate_multiple_formats(self, 
                                 topic: str, 
                                 formats: List[str]) -> Dict[str, Dict[str, Any]]:
        """生成多种格式的内容"""
        
        results = {}
        
        format_configs = {
            "blog_post": {
                "content_type": "informative", 
                "target_audience": "general readers",
                "style_requirements": "engaging and accessible"
            },
            "technical_document": {
                "content_type": "technical",
                "target_audience": "professionals",
                "style_requirements": "precise and detailed"
            },
            "social_media": {
                "content_type": "promotional",
                "target_audience": "social media users",
                "style_requirements": "concise and engaging"
            },
            "academic_paper": {
                "content_type": "academic",
                "target_audience": "researchers",
                "style_requirements": "formal and rigorous"
            }
        }
        
        for format_name in formats:
            if format_name in format_configs:
                config = format_configs[format_name]
                
                result = self.generate_article(
                    topic=topic,
                    content_type=config["content_type"],
                    target_audience=config["target_audience"],
                    style_requirements=config["style_requirements"]
                )
                
                results[format_name] = result
        
        return results

class MultiModalContentSystem(dspy.Module):
    """多模态内容系统"""
    
    def __init__(self):
        super().__init__()
        
        # 内容规划器
        self.multimodal_planner = dspy.ChainOfThought(
            "topic, modalities -> reasoning, multimodal_plan",
            instructions="""规划多模态内容：
            1. 分析不同模态的优势和适用场景
            2. 设计模态间的协同和互补
            3. 规划内容的整体体验流程
            4. 确保各模态内容的一致性"""
        )
        
        # 文本内容生成器
        self.text_generator = dspy.ChainOfThought(
            "topic, text_requirements, other_modalities -> reasoning, text_content",
            instructions="""生成与其他模态协调的文本内容：
            1. 考虑与图像、音频等的配合
            2. 预留其他模态的展示空间
            3. 使用指示性语言引导多模态体验
            4. 保持文本的独立完整性"""
        )
        
        # 图像描述生成器
        self.image_descriptor = dspy.ChainOfThought(
            "topic, text_content, image_purpose -> reasoning, image_description",
            instructions="""生成图像描述和要求：
            1. 分析需要什么类型的视觉内容
            2. 描述图像的构图和元素
            3. 指定图像的风格和色调
            4. 确保与文本内容的协调性"""
        )
        
        # 脚本生成器
        self.script_generator = dspy.ChainOfThought(
            "topic, content_plan, duration -> reasoning, script",
            instructions="""生成音视频脚本：
            1. 设计吸引人的开头和结尾
            2. 组织清晰的内容结构
            3. 包含必要的停顿和强调
            4. 考虑视觉元素的配合时机"""
        )
    
    def create_multimodal_content(self, 
                                 topic: str, 
                                 modalities: List[str]) -> Dict[str, Any]:
        """创建多模态内容"""
        
        # 1. 多模态规划
        planning = self.multimodal_planner(
            topic=topic,
            modalities=", ".join(modalities)
        )
        
        results = {
            "topic": topic,
            "modalities": modalities,
            "overall_plan": planning.multimodal_plan,
            "content_by_modality": {}
        }
        
        # 2. 生成各模态内容
        
        # 文本内容
        if "text" in modalities:
            text_content = self.text_generator(
                topic=topic,
                text_requirements="主要内容载体",
                other_modalities=", ".join([m for m in modalities if m != "text"])
            )
            results["content_by_modality"]["text"] = text_content.text_content
        
        # 图像描述
        if "image" in modalities:
            image_desc = self.image_descriptor(
                topic=topic,
                text_content=results["content_by_modality"].get("text", ""),
                image_purpose="支持和增强文本内容"
            )
            results["content_by_modality"]["image"] = image_desc.image_description
        
        # 音频/视频脚本
        if any(modality in modalities for modality in ["audio", "video"]):
            script_content = self.script_generator(
                topic=topic,
                content_plan=planning.multimodal_plan,
                duration="5-10分钟"
            )
            results["content_by_modality"]["script"] = script_content.script
        
        return results

# 使用示例
def demonstrate_content_systems():
    """演示内容系统"""
    
    # 文本摘要系统
    summarizer = TextSummarizationSystem()
    
    # 内容生成系统
    generator = ContentGenerationSystem()
    
    # 多模态内容系统
    multimodal = MultiModalContentSystem()
    
    print("📝 内容生成系统演示")
    print("=" * 50)
    
    # 测试文本摘要
    sample_text = """
    人工智能（Artificial Intelligence, AI）是计算机科学的一个分支，
    致力于创建能够执行通常需要人类智能的任务的智能系统。AI的发展历程可以
    追溯到20世纪50年代，当时科学家们开始探索让机器模拟人类思维的可能性。
    现代AI技术包括机器学习、深度学习、自然语言处理、计算机视觉等多个子领域。
    这些技术正在改变我们的生活方式，从智能手机的语音助手到自动驾驶汽车，
    AI正在各个行业发挥着重要作用。
    """
    
    print("\n📄 文本摘要测试:")
    summary_result = summarizer(sample_text, target_length=50)
    print(f"原文长度: {len(sample_text)} 字符")
    print(f"摘要: {summary_result['summary']}")
    print(f"质量评分: {summary_result['quality_score']}")
    
    # 测试内容生成
    print("\n✍️ 内容生成测试:")
    article_result = generator.generate_article(
        topic="区块链技术",
        content_type="informative",
        target_audience="技术爱好者"
    )
    print(f"生成内容预览: {article_result['generated_content'][:200]}...")
    print(f"评审得分: {article_result['review_score']}")
    
    # 测试多格式内容生成
    print("\n🔄 多格式内容生成测试:")
    multi_format_result = generator.generate_multiple_formats(
        topic="可持续发展",
        formats=["blog_post", "social_media"]
    )
    
    for format_name, content in multi_format_result.items():
        print(f"{format_name}: {content['generated_content'][:100]}...")
    
    # 测试多模态内容
    print("\n🎭 多模态内容测试:")
    multimodal_result = multimodal.create_multimodal_content(
        topic="健康饮食",
        modalities=["text", "image", "video"]
    )
    
    print(f"整体规划: {multimodal_result['overall_plan'][:100]}...")
    for modality, content in multimodal_result['content_by_modality'].items():
        print(f"{modality}: {str(content)[:100]}...")
    
    return summarizer, generator, multimodal

# demo_content_systems = demonstrate_content_systems()

3. 代码生成和程序修复

DSPy在代码相关任务中也有出色的表现。

class CodeGenerationSystem(dspy.Module):
    """代码生成系统"""
    
    def __init__(self):
        super().__init__()
        
        # 需求分析器
        self.requirement_analyzer = dspy.ChainOfThought(
            "requirement_description -> reasoning, parsed_requirements",
            instructions="""分析编程需求：
            1. 识别核心功能和约束条件
            2. 确定输入输出规格
            3. 分析算法复杂度要求
            4. 识别可能的边界情况"""
        )
        
        # 算法设计器
        self.algorithm_designer = dspy.ChainOfThought(
            "requirements, language -> reasoning, algorithm_design",
            instructions="""设计算法方案：
            1. 选择适合的算法和数据结构
            2. 设计整体架构和模块划分
            3. 考虑性能优化策略
            4. 规划错误处理机制"""
        )
        
        # 代码生成器
        self.code_generator = dspy.ChainOfThought(
            "requirements, algorithm_design, language -> reasoning, code",
            instructions="""生成高质量代码：
            1. 遵循语言最佳实践和规范
            2. 添加必要的注释和文档
            3. 实现完整的错误处理
            4. 确保代码的可读性和维护性"""
        )
        
        # 代码审查器
        self.code_reviewer = dspy.ChainOfThought(
            "code, requirements -> reasoning, review_result, suggestions",
            instructions="""审查代码质量：
            1. 检查语法正确性和逻辑错误
            2. 评估代码风格和规范遵循
            3. 验证功能完整性和边界处理
            4. 提出改进建议和优化方案"""
        )
        
        # 测试生成器
        self.test_generator = dspy.ChainOfThought(
            "code, requirements -> reasoning, test_cases",
            instructions="""生成测试用例：
            1. 设计正常情况的测试用例
            2. 包含边界条件和异常情况
            3. 确保测试覆盖率
            4. 提供预期输出和验证方法"""
        )
    
    def generate_code(self, 
                     requirement: str, 
                     language: str = "Python", 
                     include_tests: bool = True) -> Dict[str, Any]:
        """生成代码"""
        
        # 1. 需求分析
        requirements_analysis = self.requirement_analyzer(
            requirement_description=requirement
        )
        
        # 2. 算法设计
        algorithm_design = self.algorithm_designer(
            requirements=requirements_analysis.parsed_requirements,
            language=language
        )
        
        # 3. 代码生成
        code_generation = self.code_generator(
            requirements=requirements_analysis.parsed_requirements,
            algorithm_design=algorithm_design.algorithm_design,
            language=language
        )
        
        # 4. 代码审查
        code_review = self.code_reviewer(
            code=code_generation.code,
            requirements=requirements_analysis.parsed_requirements
        )
        
        result = {
            "requirement": requirement,
            "language": language,
            "requirements_analysis": requirements_analysis.parsed_requirements,
            "algorithm_design": algorithm_design.algorithm_design,
            "generated_code": code_generation.code,
            "code_reasoning": code_generation.reasoning,
            "review_result": code_review.review_result,
            "suggestions": code_review.suggestions
        }
        
        # 5. 生成测试用例（如果需要）
        if include_tests:
            test_generation = self.test_generator(
                code=code_generation.code,
                requirements=requirements_analysis.parsed_requirements
            )
            result["test_cases"] = test_generation.test_cases
            result["test_reasoning"] = test_generation.reasoning
        
        return result

class CodeDebuggingSystem(dspy.Module):
    """代码调试系统"""
    
    def __init__(self):
        super().__init__()
        
        # 错误分析器
        self.error_analyzer = dspy.ChainOfThought(
            "code, error_message -> reasoning, error_analysis",
            instructions="""分析代码错误：
            1. 识别错误类型（语法、逻辑、运行时）
            2. 定位错误的具体位置
            3. 分析错误的根本原因
            4. 评估错误的严重程度"""
        )
        
        # 修复方案生成器
        self.fix_generator = dspy.ChainOfThought(
            "code, error_analysis -> reasoning, fix_suggestions",
            instructions="""生成修复方案：
            1. 提供多个可能的修复方案
            2. 解释每种方案的优缺点
            3. 推荐最佳修复策略
            4. 考虑对其他部分的影响"""
        )
        
        # 代码修复器
        self.code_fixer = dspy.ChainOfThought(
            "original_code, fix_strategy -> reasoning, fixed_code",
            instructions="""修复代码错误：
            1. 应用选定的修复策略
            2. 保持代码风格的一致性
            3. 最小化对原代码的修改
            4. 确保修复后的代码正确性"""
        )
        
        # 修复验证器
        self.fix_validator = dspy.ChainOfThought(
            "original_code, fixed_code, error_message -> reasoning, validation_result",
            instructions="""验证修复效果：
            1. 确认原始错误是否已解决
            2. 检查是否引入新的错误
            3. 验证功能完整性
            4. 评估修复质量"""
        )
    
    def debug_code(self, 
                   code: str, 
                   error_message: str, 
                   context: str = "") -> Dict[str, Any]:
        """调试代码"""
        
        # 1. 错误分析
        error_analysis = self.error_analyzer(
            code=code,
            error_message=error_message
        )
        
        # 2. 生成修复方案
        fix_suggestions = self.fix_generator(
            code=code,
            error_analysis=error_analysis.error_analysis
        )
        
        # 3. 修复代码
        fixed_code = self.code_fixer(
            original_code=code,
            fix_strategy=fix_suggestions.fix_suggestions
        )
        
        # 4. 验证修复
        validation = self.fix_validator(
            original_code=code,
            fixed_code=fixed_code.fixed_code,
            error_message=error_message
        )
        
        return {
            "original_code": code,
            "error_message": error_message,
            "error_analysis": error_analysis.error_analysis,
            "fix_suggestions": fix_suggestions.fix_suggestions,
            "fixed_code": fixed_code.fixed_code,
            "fix_reasoning": fixed_code.reasoning,
            "validation_result": validation.validation_result,
            "is_fixed": "修复成功" in validation.validation_result or "解决" in validation.validation_result
        }

class CodeOptimizationSystem(dspy.Module):
    """代码优化系统"""
    
    def __init__(self):
        super().__init__()
        
        # 性能分析器
        self.performance_analyzer = dspy.ChainOfThought(
            "code -> reasoning, performance_analysis",
            instructions="""分析代码性能：
            1. 识别性能瓶颈和热点
            2. 分析时间复杂度和空间复杂度
            3. 评估算法效率
            4. 识别优化机会"""
        )
        
        # 优化建议生成器
        self.optimization_advisor = dspy.ChainOfThought(
            "code, performance_analysis -> reasoning, optimization_suggestions",
            instructions="""提供优化建议：
            1. 算法级别的优化策略
            2. 数据结构的改进建议
            3. 代码结构的重构建议
            4. 性能调优的具体方案"""
        )
        
        # 代码优化器
        self.code_optimizer = dspy.ChainOfThought(
            "original_code, optimization_plan -> reasoning, optimized_code",
            instructions="""优化代码实现：
            1. 应用性能优化策略
            2. 改进算法和数据结构
            3. 保持功能等价性
            4. 提高代码可读性"""
        )
        
        # 优化效果评估器
        self.optimization_evaluator = dspy.ChainOfThought(
            "original_code, optimized_code -> reasoning, improvement_analysis",
            instructions="""评估优化效果：
            1. 比较性能改进程度
            2. 分析复杂度变化
            3. 评估代码质量提升
            4. 识别可能的副作用"""
        )
    
    def optimize_code(self, code: str, optimization_goals: str = "performance") -> Dict[str, Any]:
        """优化代码"""
        
        # 1. 性能分析
        performance_analysis = self.performance_analyzer(code=code)
        
        # 2. 优化建议
        optimization_suggestions = self.optimization_advisor(
            code=code,
            performance_analysis=performance_analysis.performance_analysis
        )
        
        # 3. 代码优化
        optimized_result = self.code_optimizer(
            original_code=code,
            optimization_plan=optimization_suggestions.optimization_suggestions
        )
        
        # 4. 效果评估
        evaluation = self.optimization_evaluator(
            original_code=code,
            optimized_code=optimized_result.optimized_code
        )
        
        return {
            "original_code": code,
            "optimization_goals": optimization_goals,
            "performance_analysis": performance_analysis.performance_analysis,
            "optimization_suggestions": optimization_suggestions.optimization_suggestions,
            "optimized_code": optimized_result.optimized_code,
            "optimization_reasoning": optimized_result.reasoning,
            "improvement_analysis": evaluation.improvement_analysis
        }

# 使用示例
def demonstrate_code_systems():
    """演示代码系统"""
    
    # 代码生成系统
    generator = CodeGenerationSystem()
    
    # 代码调试系统
    debugger = CodeDebuggingSystem()
    
    # 代码优化系统
    optimizer = CodeOptimizationSystem()
    
    print("💻 代码处理系统演示")
    print("=" * 50)
    
    # 测试代码生成
    print("\n🔨 代码生成测试:")
    code_gen_result = generator.generate_code(
        requirement="创建一个函数来计算斐波那契数列的第n项",
        language="Python",
        include_tests=True
    )
    
    print("需求分析:", code_gen_result["requirements_analysis"][:100] + "...")
    print("生成的代码:")
    print(code_gen_result["generated_code"][:300] + "...")
    
    # 测试代码调试
    print("\n🐛 代码调试测试:")
    buggy_code = """
def divide_numbers(a, b):
    result = a / b
    return result

print(divide_numbers(10, 0))
"""
    
    debug_result = debugger.debug_code(
        code=buggy_code,
        error_message="ZeroDivisionError: division by zero"
    )
    
    print("错误分析:", debug_result["error_analysis"][:100] + "...")
    print("修复建议:", debug_result["fix_suggestions"][:100] + "...")
    print("修复状态:", "✅" if debug_result["is_fixed"] else "❌")
    
    # 测试代码优化
    print("\n⚡ 代码优化测试:")
    slow_code = """
def find_max(numbers):
    max_num = numbers[0]
    for i in range(1, len(numbers)):
        for j in range(len(numbers)):
            if numbers[j] > max_num:
                max_num = numbers[j]
    return max_num
"""
    
    optimization_result = optimizer.optimize_code(
        code=slow_code,
        optimization_goals="提高时间复杂度"
    )
    
    print("性能分析:", optimization_result["performance_analysis"][:100] + "...")
    print("优化建议:", optimization_result["optimization_suggestions"][:100] + "...")
    print("优化后代码预览:", optimization_result["optimized_code"][:200] + "...")
    
    return generator, debugger, optimizer

# demo_code_systems = demonstrate_code_systems()

4. 对话系统和聊天机器人

对话系统是DSPy的另一个重要应用场景。

class ConversationalAI(dspy.Module):
    """对话AI系统"""
    
    def __init__(self):
        super().__init__()
        
        # 对话状态管理器
        self.conversation_history = []
        self.context_memory = {}
        
        # 意图识别器
        self.intent_classifier = dspy.ChainOfThought(
            "user_message, conversation_context -> reasoning, intent, entities",
            instructions="""识别用户意图和实体：
            1. 分析用户消息的核心意图
            2. 提取关键实体和参数
            3. 考虑对话历史上下文
            4. 识别情感倾向和紧急程度"""
        )
        
        # 响应生成器
        self.response_generator = dspy.ChainOfThought(
            "user_message, intent, context, personality -> reasoning, response",
            instructions="""生成合适的响应：
            1. 基于识别的意图生成相关回复
            2. 保持对话的连贯性和自然性
            3. 体现设定的个性特征
            4. 适当使用上下文信息"""
        )
        
        # 对话评估器
        self.conversation_evaluator = dspy.ChainOfThought(
            "conversation_turn, response_quality_criteria -> reasoning, quality_score",
            instructions="""评估对话质量：
            1. 响应的相关性和准确性
            2. 对话的自然度和流畅性
            3. 情感理解和共情能力
            4. 信息的有用性和完整性"""
        )
        
        # 上下文管理器
        self.context_manager = dspy.ChainOfThought(
            "conversation_history, current_turn -> reasoning, updated_context",
            instructions="""管理对话上下文：
            1. 更新关键信息和状态
            2. 识别话题变化和转折
            3. 维护长期和短期记忆
            4. 清理过时或无关信息"""
        )
    
    def chat(self, user_message: str, user_id: str = "default") -> Dict[str, Any]:
        """处理聊天消息"""
        
        # 获取用户的对话历史
        user_history = self._get_user_history(user_id)
        
        # 1. 意图识别
        intent_result = self.intent_classifier(
            user_message=user_message,
            conversation_context=self._format_context(user_history)
        )
        
        # 2. 生成响应
        response_result = self.response_generator(
            user_message=user_message,
            intent=intent_result.intent,
            context=self._format_context(user_history),
            personality="友善、乐于助人、专业"
        )
        
        # 3. 评估响应质量
        quality_evaluation = self.conversation_evaluator(
            conversation_turn=f"用户: {user_message}\nAI: {response_result.response}",
            response_quality_criteria="相关性、自然度、有用性、准确性"
        )
        
        # 4. 更新上下文
        context_update = self.context_manager(
            conversation_history=self._format_context(user_history),
            current_turn=f"用户: {user_message}\nAI: {response_result.response}"
        )
        
        # 5. 保存对话记录
        conversation_turn = {
            "user_message": user_message,
            "ai_response": response_result.response,
            "intent": intent_result.intent,
            "entities": getattr(intent_result, 'entities', ''),
            "quality_score": quality_evaluation.quality_score,
            "timestamp": time.time()
        }
        
        self._save_conversation_turn(user_id, conversation_turn)
        
        return {
            "user_id": user_id,
            "user_message": user_message,
            "ai_response": response_result.response,
            "intent": intent_result.intent,
            "entities": getattr(intent_result, 'entities', ''),
            "reasoning": response_result.reasoning,
            "quality_score": quality_evaluation.quality_score,
            "context_update": context_update.updated_context
        }
    
    def _get_user_history(self, user_id: str) -> List[Dict]:
        """获取用户对话历史"""
        # 简化实现：从内存获取最近的对话
        return [turn for turn in self.conversation_history 
                if turn.get('user_id') == user_id][-10:]  # 最近10轮对话
    
    def _format_context(self, history: List[Dict]) -> str:
        """格式化对话上下文"""
        if not history:
            return "这是对话的开始。"
        
        context_lines = []
        for turn in history[-5:]:  # 最近5轮
            context_lines.append(f"用户: {turn.get('user_message', '')}")
            context_lines.append(f"AI: {turn.get('ai_response', '')}")
        
        return "\n".join(context_lines)
    
    def _save_conversation_turn(self, user_id: str, turn: Dict):
        """保存对话轮次"""
        turn['user_id'] = user_id
        self.conversation_history.append(turn)
        
        # 限制历史记录数量
        if len(self.conversation_history) > 1000:
            self.conversation_history = self.conversation_history[-800:]

class MultiModalChatbot(ConversationalAI):
    """多模态聊天机器人"""
    
    def __init__(self):
        super().__init__()
        
        # 多模态内容理解器
        self.multimodal_processor = dspy.ChainOfThought(
            "text_input, modality_type, content_description -> reasoning, interpretation",
            instructions="""处理多模态输入：
            1. 理解不同模态的内容含义
            2. 将多模态信息转化为文本描述
            3. 识别跨模态的关联和互补
            4. 整合形成统一的理解"""
        )
        
        # 多模态响应规划器
        self.multimodal_planner = dspy.ChainOfThought(
            "user_input, response_intent -> reasoning, response_plan",
            instructions="""规划多模态响应：
            1. 决定最适合的响应模态组合
            2. 设计各模态内容的协调方案
            3. 考虑用户偏好和场景需求
            4. 确保响应的丰富性和有效性"""
        )
    
    def chat_multimodal(self, 
                       text_input: str = "",
                       image_description: str = "",
                       audio_transcription: str = "",
                       user_id: str = "default") -> Dict[str, Any]:
        """处理多模态聊天"""
        
        # 1. 处理多模态输入
        multimodal_inputs = []
        
        if text_input:
            multimodal_inputs.append(("text", text_input))
        
        if image_description:
            image_interpretation = self.multimodal_processor(
                text_input=text_input,
                modality_type="image",
                content_description=image_description
            )
            multimodal_inputs.append(("image", image_interpretation.interpretation))
        
        if audio_transcription:
            audio_interpretation = self.multimodal_processor(
                text_input=text_input,
                modality_type="audio",
                content_description=audio_transcription
            )
            multimodal_inputs.append(("audio", audio_interpretation.interpretation))
        
        # 2. 整合多模态输入为统一消息
        integrated_message = self._integrate_multimodal_inputs(multimodal_inputs)
        
        # 3. 使用基础聊天功能处理
        basic_response = self.chat(integrated_message, user_id)
        
        # 4. 规划多模态响应
        multimodal_plan = self.multimodal_planner(
            user_input=integrated_message,
            response_intent=basic_response['intent']
        )
        
        # 5. 生成多模态响应内容
        multimodal_response = self._generate_multimodal_response(
            basic_response['ai_response'],
            multimodal_plan.response_plan
        )
        
        return {
            **basic_response,
            "multimodal_inputs": multimodal_inputs,
            "integrated_message": integrated_message,
            "multimodal_plan": multimodal_plan.response_plan,
            "multimodal_response": multimodal_response
        }
    
    def _integrate_multimodal_inputs(self, inputs: List[tuple]) -> str:
        """整合多模态输入"""
        
        integrated_parts = []
        
        for modality, content in inputs:
            if modality == "text":
                integrated_parts.append(f"用户说: {content}")
            elif modality == "image":
                integrated_parts.append(f"用户分享了图片，内容: {content}")
            elif modality == "audio":
                integrated_parts.append(f"用户的语音消息: {content}")
        
        return "\n".join(integrated_parts)
    
    def _generate_multimodal_response(self, text_response: str, plan: str) -> Dict[str, str]:
        """生成多模态响应"""
        
        # 这里是简化实现，实际应用中需要调用相应的多模态生成模块
        
        response = {
            "text": text_response
        }
        
        # 根据计划生成其他模态内容
        if "图片" in plan or "图像" in plan:
            response["image_suggestion"] = "建议生成相关图片以增强理解"
        
        if "语音" in plan or "音频" in plan:
            response["audio_suggestion"] = "建议使用语音回复以增加亲切感"
        
        return response

class TaskOrientedChatbot(ConversationalAI):
    """任务导向型聊天机器人"""
    
    def __init__(self):
        super().__init__()
        
        # 任务状态管理
        self.active_tasks = {}
        
        # 任务识别器
        self.task_identifier = dspy.ChainOfThought(
            "user_message, conversation_context -> reasoning, task_type, task_params",
            instructions="""识别用户任务需求：
            1. 判断是否涉及具体任务
            2. 识别任务类型和关键参数
            3. 评估任务的复杂度和步骤
            4. 确定完成任务所需的信息"""
        )
        
        # 任务执行规划器
        self.task_planner = dspy.ChainOfThought(
            "task_type, task_params, user_context -> reasoning, execution_plan",
            instructions="""规划任务执行：
            1. 分解任务为具体步骤
            2. 识别所需的信息和资源
            3. 设计与用户的交互流程
            4. 制定完成标准和验证方法"""
        )
        
        # 任务执行器
        self.task_executor = dspy.ChainOfThought(
            "task_step, available_info, context -> reasoning, step_result, next_action",
            instructions="""执行任务步骤：
            1. 基于可用信息执行当前步骤
            2. 生成步骤结果或中间输出
            3. 决定下一步行动方案
            4. 识别需要用户提供的额外信息"""
        )
    
    def chat_with_task_support(self, user_message: str, user_id: str = "default") -> Dict[str, Any]:
        """支持任务的聊天处理"""
        
        # 1. 基础聊天处理
        basic_response = self.chat(user_message, user_id)
        
        # 2. 任务识别
        task_identification = self.task_identifier(
            user_message=user_message,
            conversation_context=self._format_context(self._get_user_history(user_id))
        )
        
        # 3. 检查是否有活跃任务
        active_task = self.active_tasks.get(user_id)
        
        if active_task:
            # 继续执行现有任务
            task_result = self._continue_task(user_id, user_message)
            
            return {
                **basic_response,
                "task_mode": True,
                "task_type": active_task["task_type"],
                "task_status": active_task["status"],
                "task_result": task_result,
                "is_task_complete": task_result.get("is_complete", False)
            }
        
        elif task_identification.task_type and task_identification.task_type != "无":
            # 启动新任务
            task_result = self._start_new_task(user_id, task_identification)
            
            return {
                **basic_response,
                "task_mode": True,
                "task_type": task_identification.task_type,
                "task_status": "started",
                "task_result": task_result,
                "is_task_complete": False
            }
        
        else:
            # 普通聊天，无任务
            return {
                **basic_response,
                "task_mode": False
            }
    
    def _start_new_task(self, user_id: str, task_identification) -> Dict[str, Any]:
        """启动新任务"""
        
        # 制定任务计划
        task_plan = self.task_planner(
            task_type=task_identification.task_type,
            task_params=task_identification.task_params,
            user_context=f"用户ID: {user_id}"
        )
        
        # 创建任务记录
        task_record = {
            "task_type": task_identification.task_type,
            "task_params": task_identification.task_params,
            "execution_plan": task_plan.execution_plan,
            "current_step": 0,
            "status": "active",
            "context": {}
        }
        
        self.active_tasks[user_id] = task_record
        
        # 执行第一步
        first_step_result = self._execute_task_step(user_id, "")
        
        return {
            "task_started": True,
            "execution_plan": task_plan.execution_plan,
            "first_step_result": first_step_result
        }
    
    def _continue_task(self, user_id: str, user_message: str) -> Dict[str, Any]:
        """继续执行任务"""
        
        return self._execute_task_step(user_id, user_message)
    
    def _execute_task_step(self, user_id: str, user_input: str) -> Dict[str, Any]:
        """执行任务步骤"""
        
        task_record = self.active_tasks.get(user_id)
        if not task_record:
            return {"error": "未找到活跃任务"}
        
        # 执行当前步骤
        step_execution = self.task_executor(
            task_step=f"步骤 {task_record['current_step'] + 1}",
            available_info=user_input,
            context=json.dumps(task_record['context'], ensure_ascii=False)
        )
        
        # 更新任务状态
        task_record['current_step'] += 1
        task_record['context']['last_step_result'] = step_execution.step_result
        
        # 检查任务是否完成
        is_complete = "完成" in step_execution.next_action or "结束" in step_execution.next_action
        
        if is_complete:
            task_record['status'] = "completed"
            del self.active_tasks[user_id]
        
        return {
            "step_number": task_record['current_step'],
            "step_result": step_execution.step_result,
            "next_action": step_execution.next_action,
            "reasoning": step_execution.reasoning,
            "is_complete": is_complete
        }

# 使用示例
def demonstrate_chat_systems():
    """演示对话系统"""
    
    # 基础对话AI
    basic_chatbot = ConversationalAI()
    
    # 多模态聊天机器人
    multimodal_chatbot = MultiModalChatbot()
    
    # 任务导向聊天机器人
    task_chatbot = TaskOrientedChatbot()
    
    print("💬 对话系统演示")
    print("=" * 50)
    
    # 测试基础对话
    print("\n🤖 基础对话测试:")
    messages = [
        "你好，我想了解人工智能",
        "AI在医疗领域有什么应用？",
        "谢谢你的解答"
    ]
    
    for i, message in enumerate(messages, 1):
        response = basic_chatbot.chat(message, "user_001")
        print(f"用户: {message}")
        print(f"AI: {response['ai_response']}")
        print(f"意图: {response['intent']}")
        print(f"质量评分: {response['quality_score']}")
        print()
    
    # 测试多模态对话
    print("\n🎭 多模态对话测试:")
    multimodal_response = multimodal_chatbot.chat_multimodal(
        text_input="这是什么？",
        image_description="一张显示猫咪在草地上玩耍的照片",
        user_id="user_002"
    )
    
    print(f"用户输入: {multimodal_response['integrated_message']}")
    print(f"AI响应: {multimodal_response['ai_response']}")
    print(f"多模态计划: {multimodal_response['multimodal_plan']}")
    
    # 测试任务导向对话
    print("\n📋 任务导向对话测试:")
    task_messages = [
        "我想预订一张明天飞往上海的机票",
        "我倾向于经济舱",
        "上午10点左右出发比较好"
    ]
    
    for message in task_messages:
        task_response = task_chatbot.chat_with_task_support(message, "user_003")
        print(f"用户: {message}")
        print(f"AI: {task_response['ai_response']}")
        print(f"任务模式: {task_response.get('task_mode', False)}")
        
        if task_response.get('task_mode'):
            print(f"任务类型: {task_response.get('task_type', 'N/A')}")
            print(f"任务状态: {task_response.get('task_status', 'N/A')}")
        print()
    
    return basic_chatbot, multimodal_chatbot, task_chatbot

# demo_chat_systems = demonstrate_chat_systems()

实践练习

练习1：构建专业领域问答系统

class ProfessionalQASystem:
    """专业领域问答系统练习"""
    
    def __init__(self, domain: str):
        self.domain = domain
        # TODO: 实现领域专家系统
    
    def build_knowledge_graph(self, domain_texts):
        """构建知识图谱"""
        # TODO: 实现知识图谱构建
        pass
    
    def expert_reasoning(self, question, knowledge_context):
        """专家推理"""
        # TODO: 实现专家级推理
        pass

# 练习任务：
# 1. 选择一个专业领域（如法律、医疗、金融）
# 2. 构建领域知识库和推理规则
# 3. 实现专家级别的问答能力

练习2：多轮对话状态管理

class AdvancedDialogueManager:
    """高级对话管理器练习"""
    
    def __init__(self):
        self.dialogue_states = {}
        self.context_windows = {}
    
    def manage_long_term_memory(self, user_id, conversation_turn):
        """管理长期记忆"""
        # TODO: 实现长期对话记忆管理
        pass
    
    def handle_context_switching(self, user_id, new_topic):
        """处理上下文切换"""
        # TODO: 实现智能上下文切换
        pass
    
    def maintain_personality_consistency(self, user_id, response):
        """保持人格一致性"""
        # TODO: 实现人格一致性维护
        pass

# 练习任务：
# 1. 实现复杂的对话状态管理
# 2. 构建个性化对话体验
# 3. 处理多话题交织的复杂对话

最佳实践

1. 应用场景选择指南

def application_scenario_guide():
    """应用场景选择指南"""
    
    scenarios = {
        '问答系统': {
            '适用场景': [
                '客户服务和技术支持',
                '教育培训和知识传播',
                '专业咨询和决策支持',
                '信息检索和知识管理'
            ],
            '技术要点': [
                '知识库构建和维护',
                '多轮对话状态管理',
                '答案质量评估和优化',
                '领域专业知识集成'
            ],
            '成功指标': [
                '答案准确率 > 85%',
                '用户满意度 > 4.0/5.0',
                '平均响应时间 < 2秒',
                '知识覆盖率 > 90%'
            ]
        },
        
        '内容生成': {
            '适用场景': [
                '营销文案和广告创意',
                '新闻报道和内容编辑',
                '教育材料和培训内容',
                '个性化推荐和定制化服务'
            ],
            '技术要点': [
                '多样化内容生成策略',
                '质量控制和一致性保证',
                '个性化定制和风格适应',
                '原创性检查和版权保护'
            ],
            '成功指标': [
                '内容质量评分 > 4.0/5.0',
                '原创性检测 > 95%',
                '用户参与度提升 > 30%',
                '生产效率提升 > 50%'
            ]
        },
        
        '代码助手': {
            '适用场景': [
                '软件开发和编程教育',
                '代码审查和质量保证',
                '自动化测试和调试',
                '技术文档生成'
            ],
            '技术要点': [
                '多语言代码理解和生成',
                '错误检测和修复建议',
                '性能优化和最佳实践',
                '安全漏洞识别和预防'
            ],
            '成功指标': [
                '代码正确率 > 90%',
                '编译通过率 > 95%',
                '开发效率提升 > 40%',
                '代码质量改善 > 30%'
            ]
        }
    }
    
    return scenarios

class ApplicationArchitect:
    """应用架构师"""
    
    def __init__(self):
        self.design_patterns = {
            'pipeline': self.design_pipeline_architecture,
            'microservice': self.design_microservice_architecture,
            'event_driven': self.design_event_driven_architecture,
            'layered': self.design_layered_architecture
        }
    
    def design_application_architecture(self, 
                                      requirements: Dict[str, Any],
                                      constraints: Dict[str, Any]) -> Dict[str, Any]:
        """设计应用架构"""
        
        # 分析需求特征
        complexity = self._analyze_complexity(requirements)
        scale = self._analyze_scale(requirements)
        performance_requirements = requirements.get('performance', {})
        
        # 选择架构模式
        recommended_pattern = self._recommend_architecture_pattern(
            complexity, scale, performance_requirements, constraints
        )
        
        # 生成架构设计
        architecture_design = self.design_patterns[recommended_pattern](
            requirements, constraints
        )
        
        return {
            'requirements': requirements,
            'constraints': constraints,
            'complexity_analysis': complexity,
            'scale_analysis': scale,
            'recommended_pattern': recommended_pattern,
            'architecture_design': architecture_design
        }
    
    def _analyze_complexity(self, requirements: Dict[str, Any]) -> str:
        """分析需求复杂度"""
        
        features = requirements.get('features', [])
        integrations = requirements.get('integrations', [])
        business_rules = requirements.get('business_rules', [])
        
        complexity_score = len(features) + len(integrations) * 2 + len(business_rules) * 1.5
        
        if complexity_score < 10:
            return 'simple'
        elif complexity_score < 25:
            return 'moderate'
        else:
            return 'complex'
    
    def _analyze_scale(self, requirements: Dict[str, Any]) -> str:
        """分析规模需求"""
        
        expected_users = requirements.get('expected_users', 100)
        data_volume = requirements.get('data_volume_gb', 1)
        concurrent_requests = requirements.get('concurrent_requests', 10)
        
        if expected_users < 1000 and data_volume < 10 and concurrent_requests < 100:
            return 'small'
        elif expected_users < 10000 and data_volume < 100 and concurrent_requests < 1000:
            return 'medium'
        else:
            return 'large'
    
    def _recommend_architecture_pattern(self, complexity, scale, performance, constraints):
        """推荐架构模式"""
        
        if complexity == 'simple' and scale == 'small':
            return 'layered'
        elif complexity == 'moderate' or scale == 'medium':
            return 'pipeline'
        elif scale == 'large' or performance.get('high_availability', False):
            return 'microservice'
        else:
            return 'event_driven'
    
    def design_pipeline_architecture(self, requirements, constraints):
        """设计管道架构"""
        
        return {
            'pattern': 'pipeline',
            'components': [
                'input_processor',
                'data_validator',
                'business_logic',
                'output_formatter',
                'result_handler'
            ],
            'data_flow': 'sequential',
            'scalability': 'vertical',
            'complexity': 'moderate'
        }
    
    def design_microservice_architecture(self, requirements, constraints):
        """设计微服务架构"""
        
        return {
            'pattern': 'microservice',
            'services': [
                'api_gateway',
                'user_service',
                'business_service',
                'data_service',
                'notification_service'
            ],
            'communication': 'rest_api',
            'scalability': 'horizontal',
            'complexity': 'high'
        }
    
    def design_event_driven_architecture(self, requirements, constraints):
        """设计事件驱动架构"""
        
        return {
            'pattern': 'event_driven',
            'components': [
                'event_bus',
                'event_producers',
                'event_consumers',
                'event_store',
                'saga_coordinator'
            ],
            'communication': 'asynchronous',
            'scalability': 'horizontal',
            'complexity': 'high'
        }
    
    def design_layered_architecture(self, requirements, constraints):
        """设计分层架构"""
        
        return {
            'pattern': 'layered',
            'layers': [
                'presentation_layer',
                'application_layer',
                'domain_layer',
                'infrastructure_layer'
            ],
            'dependencies': 'top_down',
            'scalability': 'limited',
            'complexity': 'low'
        }

2. 性能优化和监控

def optimization_strategies():
    """性能优化策略"""
    
    strategies = {
        '响应时间优化': [
            '实施智能缓存策略',
            '优化模型推理速度',
            '使用异步处理模式',
            '实现请求去重和批处理'
        ],
        
        '准确性提升': [
            '增强训练数据质量',
            '实施多模型集成',
            '建立持续学习机制',
            '加强结果验证和纠错'
        ],
        
        '可扩展性增强': [
            '采用微服务架构',
            '实现水平扩展机制',
            '使用负载均衡策略',
            '建立弹性扩容机制'
        ],
        
        '成本控制': [
            '优化API调用策略',
            '实施智能资源调度',
            '使用模型压缩技术',
            '建立成本监控告警'
        ]
    }
    
    return strategies

class PerformanceOptimizer:
    """性能优化器"""
    
    def __init__(self):
        self.optimization_techniques = [
            'caching',
            'batching',
            'async_processing',
            'model_optimization',
            'resource_pooling'
        ]
    
    def optimize_application_performance(self, 
                                       application_metrics: Dict[str, Any],
                                       optimization_goals: Dict[str, Any]) -> Dict[str, Any]:
        """优化应用性能"""
        
        # 分析当前性能瓶颈
        bottlenecks = self._identify_bottlenecks(application_metrics)
        
        # 制定优化方案
        optimization_plan = self._create_optimization_plan(
            bottlenecks, optimization_goals
        )
        
        # 估算优化效果
        expected_improvements = self._estimate_improvements(
            optimization_plan, application_metrics
        )
        
        return {
            'current_metrics': application_metrics,
            'identified_bottlenecks': bottlenecks,
            'optimization_plan': optimization_plan,
            'expected_improvements': expected_improvements,
            'implementation_priority': self._prioritize_optimizations(optimization_plan)
        }
    
    def _identify_bottlenecks(self, metrics: Dict[str, Any]) -> List[str]:
        """识别性能瓶颈"""
        
        bottlenecks = []
        
        # 响应时间检查
        if metrics.get('avg_response_time', 0) > 2000:  # 2秒
            bottlenecks.append('high_response_time')
        
        # 错误率检查
        if metrics.get('error_rate', 0) > 0.05:  # 5%
            bottlenecks.append('high_error_rate')
        
        # 资源利用率检查
        if metrics.get('cpu_utilization', 0) > 0.8:  # 80%
            bottlenecks.append('high_cpu_usage')
        
        if metrics.get('memory_utilization', 0) > 0.8:  # 80%
            bottlenecks.append('high_memory_usage')
        
        # 并发处理检查
        if metrics.get('queue_length', 0) > 100:
            bottlenecks.append('processing_queue_overflow')
        
        return bottlenecks
    
    def _create_optimization_plan(self, 
                                 bottlenecks: List[str], 
                                 goals: Dict[str, Any]) -> Dict[str, Any]:
        """创建优化计划"""
        
        plan = {
            'immediate_actions': [],
            'short_term_improvements': [],
            'long_term_strategies': []
        }
        
        for bottleneck in bottlenecks:
            if bottleneck == 'high_response_time':
                plan['immediate_actions'].append('启用响应缓存')
                plan['short_term_improvements'].append('优化数据库查询')
                plan['long_term_strategies'].append('实施CDN和边缘计算')
            
            elif bottleneck == 'high_error_rate':
                plan['immediate_actions'].append('增强错误处理')
                plan['short_term_improvements'].append('改进输入验证')
                plan['long_term_strategies'].append('建立自动恢复机制')
            
            # ... 其他瓶颈的处理方案
        
        return plan
    
    def _estimate_improvements(self, 
                              plan: Dict[str, Any], 
                              current_metrics: Dict[str, Any]) -> Dict[str, Any]:
        """估算改进效果"""
        
        # 这里使用简化的估算模型
        improvements = {}
        
        if '启用响应缓存' in plan.get('immediate_actions', []):
            improvements['response_time_reduction'] = '30-50%'
        
        if '优化数据库查询' in plan.get('short_term_improvements', []):
            improvements['database_performance'] = '20-40%'
        
        if '增强错误处理' in plan.get('immediate_actions', []):
            improvements['error_rate_reduction'] = '50-70%'
        
        return improvements
    
    def _prioritize_optimizations(self, plan: Dict[str, Any]) -> List[Dict[str, Any]]:
        """优化方案优先级排序"""
        
        all_actions = []
        
        # 立即行动（高优先级）
        for action in plan.get('immediate_actions', []):
            all_actions.append({
                'action': action,
                'priority': 'high',
                'timeline': '1-2 days',
                'effort': 'low'
            })
        
        # 短期改进（中优先级）
        for action in plan.get('short_term_improvements', []):
            all_actions.append({
                'action': action,
                'priority': 'medium',
                'timeline': '1-2 weeks',
                'effort': 'medium'
            })
        
        # 长期策略（低优先级）
        for action in plan.get('long_term_strategies', []):
            all_actions.append({
                'action': action,
                'priority': 'low',
                'timeline': '1-3 months',
                'effort': 'high'
            })
        
        return all_actions

通过本章的学习，你应该掌握了DSPy在各种实际应用场景中的实现方法。从问答系统到内容生成，从代码助手到对话机器人，这些案例展示了DSPy的强大功能和广泛适用性。在实际项目中，要根据具体需求选择合适的技术组合，并持续优化和改进系统性能。