pytest_park.core.history

[docs] module pytest_park.core.history
from __future__ importannotationsfrom collections importdefaultdictfrom pytest_park.models import(BenchmarkCase,BenchmarkRun,MethodHistoryComparison,MethodHistoryPoint,PriorRunComparison,TrendPoint,)class HistoryAnalyzer:[docs]
    """Analyzes benchmark performance history and trends across multiple runs."""def __init__(self,runs:list[BenchmarkRun])->None:self.runs=runsdef build_trends(self)->dict[str,list[TrendPoint]]:[docs]
        """Build time-series means per case across run history."""series:dict[str,list[TrendPoint]]=defaultdict(list)forruninself.runs:forcaseinrun.cases:series[case.case_key].append(TrendPoint(run_id=run.run_id,timestamp=run.created_at,mean=case.stats.mean))forpointsinseries.values():points.sort(key=lambdaitem:(item.timestampisNone,item.timestamp,item.run_id))returndict(series)def build_method_history([docs]
self,method:str,distinct_params:list[str]|None=None,)->list[MethodHistoryPoint]:        """Build method mean history across runs."""history:list[MethodHistoryPoint]=[]forruninself.runs:method_cases=[caseforcaseinrun.casesifcase.normalized_name==method]ifnotmethod_cases:continuegroups:dict[str,list[BenchmarkCase]]=defaultdict(list)forcaseinmethod_cases:groups[_distinct_label(case,distinct_params)].append(case)fordistinct_label_val,casesingroups.items():means=[case.stats.meanforcaseincases]history.append(MethodHistoryPoint(run_id=run.run_id,timestamp=run.created_at.isoformat()ifrun.created_atelseNone,method=method,distinct=distinct_label_val,mean=sum(means)/len(means),))history.sort(key=lambdaitem:(item.timestampisNone,item.timestamp,item.run_id,item.distinct))returnhistorydef compare_to_reference([docs]
self,reference_run:BenchmarkRun,method:str,distinct_params:list[str]|None=None,)->list[MethodHistoryComparison]:        """Compare method mean over runs against a fixed reference run mean."""reference_history=HistoryAnalyzer([reference_run]).build_method_history(method,distinct_params)reference_by_distinct={point.distinct:point.meanforpointinreference_history}compared:list[MethodHistoryComparison]=[]forpointinself.build_method_history(method,distinct_params):baseline=reference_by_distinct.get(point.distinct)ifbaselineisNoneorbaseline<=0:continuecurrent=point.meandelta_pct=((current-baseline)/baseline)*100.0compared.append(MethodHistoryComparison(run_id=point.run_id,timestamp=point.timestamp,method=point.method,distinct=point.distinct,mean=current,reference_mean=baseline,delta_pct=delta_pct,speedup=baseline/currentifcurrent>0else0.0,))returncompareddef compare_to_all_prior([docs]
self,candidate_run:BenchmarkRun,method:str,distinct_params:list[str]|None=None,)->list[PriorRunComparison]:        """Compare candidate method means against every prior run in history."""candidate_index=_method_mean_index(candidate_run,method,distinct_params)ifnotcandidate_index:return[]candidate_position=_run_index(self.runs,candidate_run)compared:list[PriorRunComparison]=[]forreference_runinself.runs[:candidate_position]:reference_index=_method_mean_index(reference_run,method,distinct_params)ifnotreference_index:continuefordistinct,candidate_meanincandidate_index.items():reference_mean=reference_index.get(distinct)ifreference_meanisNoneorreference_mean<=0:continuedelta_pct=((candidate_mean-reference_mean)/reference_mean)*100.0compared.append(PriorRunComparison(method=method,candidate_run_id=candidate_run.run_id,reference_run_id=reference_run.run_id,distinct=distinct,mean=candidate_mean,reference_mean=reference_mean,delta_pct=delta_pct,speedup=reference_mean/candidate_meanifcandidate_mean>0else0.0,reference_timestamp=(reference_run.created_at.isoformat()ifreference_run.created_atelseNone),))compared.sort(key=lambdaitem:(item.reference_timestampisNone,item.reference_timestamp,item.reference_run_id,item.distinct,))returncompared# ---------------------------------------------------------------------------# Module-level convenience functions# ---------------------------------------------------------------------------[docs]
def build_trends(runs:list[BenchmarkRun])->dict[str,list[TrendPoint]]:    """Build time-series means per case across run history."""returnHistoryAnalyzer(runs).build_trends()def build_method_history([docs]
runs:list[BenchmarkRun],method:str,distinct_params:list[str]|None=None,)->list[MethodHistoryPoint]:    """Build method mean history across runs."""returnHistoryAnalyzer(runs).build_method_history(method,distinct_params)def compare_method_history_to_reference([docs]
runs:list[BenchmarkRun],reference_run:BenchmarkRun,method:str,distinct_params:list[str]|None=None,)->list[MethodHistoryComparison]:    """Compare method mean over runs against reference run mean."""returnHistoryAnalyzer(runs).compare_to_reference(reference_run,method,distinct_params)def compare_method_to_all_prior_runs([docs]
runs:list[BenchmarkRun],candidate_run:BenchmarkRun,method:str,distinct_params:list[str]|None=None,)->list[PriorRunComparison]:    """Compare candidate method means against all prior runs."""returnHistoryAnalyzer(runs).compare_to_all_prior(candidate_run,method,distinct_params)# ---------------------------------------------------------------------------# Private helpers# ---------------------------------------------------------------------------def _distinct_label(case:BenchmarkCase,distinct_params:list[str]|None)->str:ifnotdistinct_params:return"all"bits=[f"{key}={case.params.get(key, 'n/a')}"forkeyindistinct_params]return",".join(bits)def _run_index(runs:list[BenchmarkRun],selected_run:BenchmarkRun)->int:forindex,runinenumerate(runs):ifrun.run_id==selected_run.run_id:returnindexraiseValueError(f"Run not found in run history: {selected_run.run_id}")def _method_mean_index(run:BenchmarkRun,method:str,distinct_params:list[str]|None,)->dict[str,float]:groups:dict[str,list[float]]=defaultdict(list)forcaseinrun.cases:ifcase.normalized_name!=method:continuegroups[_distinct_label(case,distinct_params)].append(case.stats.mean)return{label:sum(values)/len(values)forlabel,valuesingroups.items()ifvalues}