pytest_park.ui

[docs] module pytest_park.ui
from __future__ importannotationsfrom typing importAnyfrom pytest_park.core import(build_method_group_split_bars,build_method_statistics,build_overview_statistics,compare_method_history_to_reference,compare_method_to_all_prior_runs,compare_runs,list_methods,select_candidate_run,select_reference_run,summarize_groups,)from pytest_park.data importload_benchmark_folderdef serve_dashboard([docs]
benchmark_folder:str,reference:str|None,group_by:list[str]|None,distinct_params:list[str]|None,original_postfix:str|None,reference_postfix:str|None,host:str,port:int,)->None:    """Serve a local NiceGUI dashboard for benchmark comparison."""try:from nicegui importapp,uiexceptImportErrorasexc:# pragma: no coverraiseRuntimeError("NiceGUI is not installed. Install project dependencies with UI support.")from excruns=load_benchmark_folder(benchmark_folder,original_postfix=original_postfix,reference_postfix=reference_postfix,)run_ids=[run.run_idforruninruns]default_reference=referenceor(run_ids[-2]iflen(run_ids)>1elserun_ids[0])default_candidate=run_ids[-1]method_options=list_methods(runs)state:dict[str,Any]={"reference":default_reference,"candidate":default_candidate,"group_by":",".join(group_byor[]),"distinct_params":",".join(distinct_paramsor[]),"method":method_options[0]ifmethod_optionselseNone,"original_postfix":original_postfixor"","reference_postfix":reference_postfixor"",}@ui.page("/")def dashboard_page()->None:ui.label("pytest-park benchmark dashboard").classes("text-h5")withui.row():ui.select(run_ids,label="Reference run",value=default_reference,on_change=lambdaevent:_set(state,"reference",event.value),)ui.select(run_ids,label="Candidate run",value=default_candidate,on_change=lambdaevent:_set(state,"candidate",event.value),)ui.input(label="Group by (comma separated)",value=state["group_by"],on_change=lambdaevent:_set(state,"group_by",str(event.value)),)ui.input(label="Distinct params (comma separated)",value=state["distinct_params"],on_change=lambdaevent:_set(state,"distinct_params",str(event.value)),)ui.input(label="Original postfix",value=state["original_postfix"],on_change=lambdaevent:_set(state,"original_postfix",str(event.value)),)ui.input(label="Reference postfix",value=state["reference_postfix"],on_change=lambdaevent:_set(state,"reference_postfix",str(event.value)),)withui.row():method_select=ui.select(method_options,label="Method",value=state["method"],on_change=lambdaevent:_set(state,"method",event.value),)withui.row().classes("w-full"):compared_runs_label=ui.label("").classes("text-subtitle2")case_count_label=ui.label("").classes("text-subtitle2")improved_label=ui.label("").classes("text-subtitle2")regressed_label=ui.label("").classes("text-subtitle2")avg_delta_label=ui.label("").classes("text-subtitle2")avg_speedup_label=ui.label("").classes("text-subtitle2")withui.row().classes("w-full"):best_case_label=ui.label("").classes("text-caption")worst_case_label=ui.label("").classes("text-caption")method_label=ui.label("")entry_history_table=ui.table(columns=[{"name":"method","label":"Method","field":"method"},{"name":"current_mean","label":"Current mean","field":"current_mean"},{"name":"reference_mean","label":"Reference mean","field":"reference_mean"},{"name":"delta","label":"Delta %","field":"delta"},{"name":"speedup","label":"Speedup","field":"speedup"},{"name":"history","label":"Average history","field":"history"},],rows=[],row_key="method",)history_chart=ui.echart({"tooltip":{"trigger":"axis"},"legend":{"data":["Mean","Delta %","Speedup"]},"xAxis":{"type":"category","data":[]},"yAxis":[{"type":"value","name":"Mean"},{"type":"value","name":"Delta %"},{"type":"value","name":"Speedup"},],"series":[{"name":"Mean","type":"line","data":[]},{"name":"Delta %","type":"line","yAxisIndex":1,"data":[]},{"name":"Speedup","type":"line","yAxisIndex":2,"data":[]},],})withui.row().classes("w-full"):delta_distribution_chart=ui.echart({"tooltip":{"trigger":"axis"},"xAxis":{"type":"category","data":[]},"yAxis":{"type":"value","name":"Cases"},"series":[{"name":"Delta distribution","type":"bar","data":[]}],}).classes("col")group_performance_chart=ui.echart({"tooltip":{"trigger":"axis"},"legend":{"data":["Avg delta %","Cases"]},"xAxis":{"type":"category","data":[]},"yAxis":[{"type":"value","name":"Avg delta %"},{"type":"value","name":"Cases"},],"series":[{"name":"Avg delta %","type":"bar","data":[]},{"name":"Cases","type":"line","yAxisIndex":1,"data":[]},],}).classes("col")top_movers_chart=ui.echart({"tooltip":{"trigger":"axis"},"xAxis":{"type":"value","name":"Delta %"},"yAxis":{"type":"category","data":[]},"series":[{"name":"Top movers","type":"bar","data":[]}],})split_chart_container=ui.column()method_prior_table=ui.table(columns=[{"name":"reference_run","label":"Reference run","field":"reference_run"},{"name":"distinct","label":"Distinct","field":"distinct"},{"name":"candidate_mean","label":"Candidate mean","field":"candidate_mean"},{"name":"reference_mean","label":"Reference mean","field":"reference_mean"},{"name":"delta","label":"Delta %","field":"delta"},{"name":"speedup","label":"Speedup","field":"speedup"},],rows=[],row_key="reference_run",)delta_table=ui.table(columns=[{"name":"group","label":"Group","field":"group"},{"name":"benchmark","label":"Benchmark","field":"benchmark"},{"name":"case_key","label":"Case key","field":"case_key"},{"name":"params","label":"Params","field":"params"},{"name":"delta","label":"Delta %","field":"delta"},{"name":"speedup","label":"Speedup","field":"speedup"},],rows=[],row_key="benchmark",)group_table=ui.table(columns=[{"name":"label","label":"Group","field":"label"},{"name":"count","label":"Cases","field":"count"},{"name":"avg","label":"Avg delta %","field":"avg"},{"name":"median","label":"Median delta %","field":"median"},{"name":"improvements","label":"Improved","field":"improvements"},{"name":"regressions","label":"Regressed","field":"regressions"},],rows=[],row_key="label",)def refresh()->None:current_runs=load_benchmark_folder(benchmark_folder,original_postfix=str(state.get("original_postfix")or""),reference_postfix=str(state.get("reference_postfix")or""),)current_methods=list_methods(current_runs)method_select.options=current_methodsmethod_select.update()selected_method=str(state.get("method")or"")ifselected_methodnotincurrent_methods:selected_method=current_methods[0]ifcurrent_methodselse""state["method"]=selected_methodreference_run=select_reference_run(current_runs,str(state["reference"]))candidate_run=select_candidate_run(current_runs,str(state["candidate"]),reference_run)group_tokens=[part.strip()forpartinstr(state["group_by"]).split(",")ifpart.strip()]distinct_tokens=[part.strip()forpartinstr(state["distinct_params"]).split(",")ifpart.strip()]deltas=compare_runs(reference_run,candidate_run,group_tokensorNone,distinct_tokensorNone)summaries=summarize_groups(deltas)overview=build_overview_statistics(deltas)compared_runs_label.text=f"Runs: {reference_run.run_id} -> {candidate_run.run_id}"case_count_label.text=f"Cases: {overview['count']}"improved_label.text=f"Improved: {overview['improved']}"regressed_label.text=f"Regressed: {overview['regressed']}"avg_delta_label.text=(f"Avg delta: {overview['avg_delta_pct']:.2f}% (median {overview['median_delta_pct']:.2f}%)")avg_speedup_label.text=f"Avg speedup: {overview['avg_speedup']:.3f}x"best_case=min(deltas,key=lambdaitem:item.delta_pct,default=None)worst_case=max(deltas,key=lambdaitem:item.delta_pct,default=None)best_case_label.text=(f"Best: {_format_case(best_case)} ({best_case.delta_pct:.2f}%)"ifbest_caseelse"Best: n/a")worst_case_label.text=(f"Worst: {_format_case(worst_case)} ({worst_case.delta_pct:.2f}%)"ifworst_caseelse"Worst: n/a")method_stats=build_method_statistics(deltas,selected_method)ifselected_methodelseNoneifmethod_stats:method_label.text=(f"Method {selected_method}: count={method_stats['count']} avg_delta={method_stats['avg_delta_pct']:.2f}% "f"avg_speedup={method_stats['avg_speedup']:.3f}")else:method_label.text="Method statistics unavailable for selected method"history=(compare_method_history_to_reference(current_runs,reference_run,selected_method,distinct_tokensorNone)ifselected_methodelse[])history_chart.options["xAxis"]["data"]=[f"{item['run_id']} ({item['distinct']})"foriteminhistory]history_chart.options["series"][0]["data"]=[round(float(item["mean"]),6)foriteminhistory]history_chart.options["series"][1]["data"]=[round(float(item["delta_pct"]),2)foriteminhistory]history_chart.options["series"][2]["data"]=[round(float(item["speedup"]),3)foriteminhistory]history_chart.update()dist_labels,dist_counts=_build_delta_distribution(deltas)delta_distribution_chart.options["xAxis"]["data"]=dist_labelsdelta_distribution_chart.options["series"][0]["data"]=dist_countsdelta_distribution_chart.update()group_labels=[item.labelforiteminsummaries]group_avg=[round(item.average_delta_pct,2)foriteminsummaries]group_counts=[item.countforiteminsummaries]group_performance_chart.options["xAxis"]["data"]=group_labelsgroup_performance_chart.options["series"][0]["data"]=group_avggroup_performance_chart.options["series"][1]["data"]=group_countsgroup_performance_chart.update()mover_labels,mover_values=_build_top_movers(deltas)top_movers_chart.options["yAxis"]["data"]=mover_labelstop_movers_chart.options["series"][0]["data"]=mover_valuestop_movers_chart.update()split_rows_by_method=build_method_group_split_bars(candidate_run)split_chart_container.clear()withsplit_chart_container:ui.label(f"Original vs new (run {candidate_run.run_id})").classes("text-subtitle1")ifnotsplit_rows_by_method:ui.label("No paired original/new benchmark data found in candidate run")formethod_name,rowsinsorted(split_rows_by_method.items()):ui.label(method_name).classes("text-subtitle2")ui.echart({"tooltip":{"trigger":"axis"},"legend":{"data":["original","new"]},"xAxis":{"type":"category","data":[str(item["argument"])foriteminrows]},"yAxis":{"type":"value","name":"Mean"},"series":[{"name":"original","type":"bar","data":[round(float(item["original"]),6)foriteminrows],},{"name":"new","type":"bar","data":[round(float(item["new"]),6)foriteminrows],},],})prior_rows=(compare_method_to_all_prior_runs(current_runs,candidate_run,selected_method,distinct_tokensorNone)ifselected_methodelse[])method_prior_table.rows=[{"reference_run":str(item["reference_run_id"]),"distinct":str(item["distinct"]),"candidate_mean":round(float(item["mean"]),6),"reference_mean":round(float(item["reference_mean"]),6),"delta":round(float(item["delta_pct"]),2),"speedup":round(float(item["speedup"]),3),}foriteminprior_rows]entry_rows:list[dict[str,Any]]=[]formethod_nameincurrent_methods:method_history=compare_method_history_to_reference(current_runs,reference_run,method_name,distinct_tokensorNone,)ifnotmethod_history:continuehistory_by_run:dict[str,list[dict[str,float|str|None]]]={}forpointinmethod_history:history_by_run.setdefault(str(point["run_id"]),[]).append(point)ordered_runs=sorted(history_by_run.keys(),key=lambdarun_id:run_ids.index(run_id)ifrun_idinrun_idselse-1)history_bits:list[str]=[]forrun_idinordered_runs:run_points=history_by_run[run_id]avg_mean=sum(float(item["mean"])foriteminrun_points)/len(run_points)avg_delta=sum(float(item["delta_pct"])foriteminrun_points)/len(run_points)history_bits.append(f"{run_id}:{avg_mean:.6f} ({avg_delta:.2f}%)")candidate_points=history_by_run.get(candidate_run.run_id)ifnotcandidate_points:continuecurrent_mean=sum(float(item["mean"])foritemincandidate_points)/len(candidate_points)reference_mean=sum(float(item["reference_mean"])foritemincandidate_points)/len(candidate_points)delta_pct=((current_mean-reference_mean)/reference_mean)*100.0ifreference_mean>0else0.0speedup=reference_mean/current_meanifcurrent_mean>0else0.0entry_rows.append({"method":method_name,"current_mean":round(current_mean,6),"reference_mean":round(reference_mean,6),"delta":round(delta_pct,2),"speedup":round(speedup,3),"history":" -> ".join(history_bits),})entry_history_table.rows=entry_rowsdelta_table.rows=[{"group":item.group_label,"benchmark":item.benchmark_name,"case_key":item.case_key,"params":", ".join(f"{k}={v}"fork,vinsorted(item.params.items())),"delta":round(item.delta_pct,2),"speedup":round(item.speedup,3),}foritemindeltas]group_table.rows=[{"label":item.label,"count":item.count,"avg":round(item.average_delta_pct,2),"median":round(item.median_delta_pct,2),"improvements":item.improvements,"regressions":item.regressions,}foriteminsummaries]ui.button("Refresh",on_click=lambda:refresh())refresh()@app.get("/favicon.ico")asyncdef favicon()->dict[str,str]:return{"status":"ok"}ui.run(host=host,port=port,reload=False,show=False)def _set(state:dict[str,Any],key:str,value:Any)->None:state[key]=valuedef _format_case(item)->str:ifitemisNone:return"n/a"params=",".join(f"{key}={value}"forkey,valueinsorted(item.params.items()))ifnotparams:returnitem.benchmark_namereturnf"{item.benchmark_name}[{params}]"def _build_delta_distribution(deltas,bin_size:float=5.0)->tuple[list[str],list[int]]:ifnotdeltas:return[],[]buckets:dict[int,int]={}foritemindeltas:bucket=int(item.delta_pct//bin_size)buckets[bucket]=buckets.get(bucket,0)+1labels:list[str]=[]counts:list[int]=[]forbucketinsorted(buckets):lower=bucket*bin_sizeupper=lower+bin_sizelabels.append(f"{lower:.0f}%..{upper:.0f}%")counts.append(buckets[bucket])returnlabels,countsdef _build_top_movers(deltas,limit:int=10)->tuple[list[str],list[float]]:ifnotdeltas:return[],[]ordered=sorted(deltas,key=lambdaitem:abs(item.delta_pct),reverse=True)[:limit]labels=[_format_case(item)foriteminordered]values=[round(item.delta_pct,2)foriteminordered]returnlabels,values