Experimenting with automatically generating mermaid diagrams from examples

KarlLundengaard · KarlLundengaard · commit 1d6972de1739 · 2025-07-31T09:22:17.000+01:00
diff --git a/app/tests/example_tests.py b/app/tests/example_tests.py
@@ -573,6 +573,12 @@ def test_custom_comparison_with_criteria_order(self, response, value, tags):
         }
         answer = "2*x^2"
         result = evaluation_function(response, answer, params, include_test_data=True)
+        with open("diagrams.html", "a") as f:
+            f.write(r'<!DOCTYPE html><html lang="en"><body><style>.mermaid {display: inline-flex;}</style>\n')
+            for g in result["criteria_graphs_vis"].values():
+                print(g)
+                f.write('<pre class="mermaid">\n'+g+'\n</pre>\n')
+            f.write('<script type="module"> import mermaid from "https://cdn.jsdelivr.net/npm/mermaid@10/dist/mermaid.esm.min.mjs";</script></body></html>')
         assert result["is_correct"] is value
         assert set(tags) == set(result["tags"])
 
diff --git a/app/utility/criteria_graph_utilities.py b/app/utility/criteria_graph_utilities.py
@@ -180,16 +180,22 @@ def json(self):
         return str(json.dumps(graph))
 
     def mermaid(self):
-        output = ["graph TD"]
+        output = ["flowchart TD"]
+        linebreak = '<br/>---<br/>'
         edges = set()
         sufficiencies = set()
         node_sets = [self.evaluations, self.criteria, self.outputs]
         node_styles = [evaluation_style, criterion_style, output_style]
+        node_keys = {}
+        for set_index, nodes in enumerate(node_sets):
+            index = 0
+            for (label, node) in nodes.items():
+                node_keys.update({label: "N_"+str(set_index)+"_"+str(index)})
         for set_index, nodes in enumerate(node_sets):
             style = node_styles[set_index]
             for (label, node) in nodes.items():
-                output.append(label+style[0]+'"'+node.summary+'"'+style[1])
-                edges.update([(edge.source.label, edge.target.label) for edge in node.outgoing+node.incoming])
+                output.append(node_keys[label]+style[0]+'"'+label+linebreak+node.summary+'"'+style[1])
+                edges.update([(node_keys[edge.source.label], node_keys[edge.target.label]) for edge in node.outgoing+node.incoming])
                 if self.sufficiencies.get(label, None) is not None:
                     sufficiencies.update([(label, sufficiency) for sufficiency in self.sufficiencies.get(label, None)])
         for edge in edges:
diff --git a/app/utility/evaluation_result_utilities.py b/app/utility/evaluation_result_utilities.py
@@ -5,6 +5,7 @@ def __init__(self):
         self._feedback = []  # A list that will hold all feedback items
         self._feedback_tags = {}  # A dictionary that holds a list with indices to all feedback items with the same tag
         self._criteria_graphs = {}
+        self._criteria_graphs_vis = {}
         self.latex = ""
         self.simplified = ""
 
@@ -41,6 +42,7 @@ def add_feedback_from_tags(self, tags, graph, custom_feedback=None):
 
     def add_criteria_graph(self, name, graph):
         self._criteria_graphs.update({name: graph.json()})
+        self._criteria_graphs_vis.update({name: graph.mermaid()})
 
     def _serialise_feedback(self) -> str:
         feedback = []
@@ -56,6 +58,7 @@ def serialise(self, include_test_data=False) -> dict:
         out.update(dict(tags=list(self._feedback_tags.keys())))
         if include_test_data is True:
             out.update(dict(criteria_graphs=self._criteria_graphs))
+            out.update(dict(criteria_graphs_vis=self._criteria_graphs_vis))
         if self.latex is not None:
             out.update(dict(response_latex=self.latex))
         if self.simplified is not None:
diff --git a/diagrams.html b/diagrams.html
@@ -0,0 +1,43 @@
+<!DOCTYPE html><html lang="en"><body><style>.mermaid {display: inline-flex;}</style>
+<pre class="mermaid">
+flowchart TD
+    subgraph "answer <= response"
+	N_0_0(["answer <= response<br/>---<br/>answer <= response"])
+	N_1_0["answer <= response_TRUE<br/>---<br/>True"]
+	N_1_0["answer <= response_FALSE<br/>---<br/>True"]
+	N_1_0["answer <= response_UNKNOWN<br/>---<br/>True"]
+	N_2_0{{"END<br/>---<br/>END"}}
+	N_1_0 --> N_2_0
+	N_0_0 --> N_1_0
+    end
+    subgraph "2+answer > response"
+	N_0_0(["2+answer > response<br/>---<br/>2+answer > response"])
+	N_1_0["2+answer > response_TRUE<br/>---<br/>True"]
+	N_1_0["2+answer > response_FALSE<br/>---<br/>True"]
+	N_1_0["2+answer > response_UNKNOWN<br/>---<br/>True"]
+	N_2_0{{"END<br/>---<br/>END"}}
+	N_1_0 --> N_2_0
+	N_0_0 --> N_1_0
+    end
+</pre>
+<script type="module"> import mermaid from "https://cdn.jsdelivr.net/npm/mermaid@10/dist/mermaid.esm.min.mjs";</script></body></html><!DOCTYPE html><html lang="en"><body><style>.mermaid {display: inline-flex;}</style>\n<pre class="mermaid">
+flowchart TD
+	N_0_0(["2+answer > response<br/>---<br/>2+answer > response"])
+	N_1_0["2+answer > response_TRUE<br/>---<br/>True"]
+	N_1_0["2+answer > response_FALSE<br/>---<br/>True"]
+	N_1_0["2+answer > response_UNKNOWN<br/>---<br/>True"]
+	N_2_0{{"END<br/>---<br/>END"}}
+	N_1_0 --> N_2_0
+	N_0_0 --> N_1_0
+</pre>
+<pre class="mermaid">
+flowchart TD
+	N_0_0(["answer <= response<br/>---<br/>answer <= response"])
+	N_1_0["answer <= response_TRUE<br/>---<br/>True"]
+	N_1_0["answer <= response_FALSE<br/>---<br/>True"]
+	N_1_0["answer <= response_UNKNOWN<br/>---<br/>True"]
+	N_2_0{{"END<br/>---<br/>END"}}
+	N_1_0 --> N_2_0
+	N_0_0 --> N_1_0
+</pre>
+<script type="module"> import mermaid from "https://cdn.jsdelivr.net/npm/mermaid@10/dist/mermaid.esm.min.mjs";</script></body></html>