Accelergy-Project
diff --git a/‎pytimeloop/fastfusion/fastmodel/fastmodel.py
Lines changed: 1 addition & 1 deletion b/‎pytimeloop/fastfusion/fastmodel/fastmodel.py
Lines changed: 1 addition & 1 deletion
diff --git a/‎pytimeloop/fastfusion/mapper/per_einsum_subspaces/subspaces/tile_shape/tile_shape.py
Lines changed: 1 addition & 1 deletion b/‎pytimeloop/fastfusion/mapper/per_einsum_subspaces/subspaces/tile_shape/tile_shape.py
Lines changed: 1 addition & 1 deletion
diff --git a/‎pytimeloop/looptree/latency/latency.py
Lines changed: 2 additions & 95 deletions b/‎pytimeloop/looptree/latency/latency.py
Lines changed: 2 additions & 95 deletions
diff --git a/‎pytimeloop/looptree/latency/memory/__init__.py b/‎pytimeloop/looptree/latency/memory/__init__.py
diff --git a/‎pytimeloop/looptree/latency/memory/base.py
Lines changed: 31 additions & 0 deletions b/‎pytimeloop/looptree/latency/memory/base.py
Lines changed: 31 additions & 0 deletions
diff --git a/‎pytimeloop/looptree/latency/memory/isl.py
Lines changed: 96 additions & 0 deletions b/‎pytimeloop/looptree/latency/memory/isl.py
Lines changed: 96 additions & 0 deletions
diff --git a/‎pytimeloop/looptree/latency/memory/summarized.py
Lines changed: 6 additions & 0 deletions b/‎pytimeloop/looptree/latency/memory/summarized.py
Lines changed: 6 additions & 0 deletions
diff --git a/‎pytimeloop/looptree/des.py renamed to ‎pytimeloop/looptree/reuse/isl/des.py b/‎pytimeloop/looptree/des.py renamed to ‎pytimeloop/looptree/reuse/isl/des.py
diff --git a/‎pytimeloop/looptree/reuse/summarized/compiler.py
Lines changed: 14 additions & 0 deletions b/‎pytimeloop/looptree/reuse/summarized/compiler.py
Lines changed: 14 additions & 0 deletions
@@ -5,7 +5,7 @@
 import sympy
 
 from pytimeloop.looptree.equivalent_ranks import EquivalentGroups
-from pytimeloop.looptree.des import IslReuseAnalysisOutput
+from pytimeloop.looptree.reuse.isl.des import IslReuseAnalysisOutput
 
 
 def compile_mapping(mapping,
 
@@ -4,7 +4,7 @@
 
 from .shape_subspace import ShapeSubspace
 
-from pytimeloop.looptree.des import IslReuseAnalysisOutput
+from pytimeloop.looptree.reuse.isl.des import IslReuseAnalysisOutput
 
 
 def explore_tile_shape(
 
@@ -1,12 +1,7 @@
-from collections import defaultdict
-
 from pytimeloop.isl.singular import get_value_from_singular_qpolynomial
-from pytimeloop.looptree.accesses import (
-    reads_and_writes_from_fill_by_parent,
-    reads_and_writes_from_fill_by_peer
-)
 from pytimeloop.looptree.latency.processors import LATENCY_PROCESSORS
-from pytimeloop.looptree.des import IslReuseAnalysisOutput
+from pytimeloop.looptree.reuse.isl.des import IslReuseAnalysisOutput
+from pytimeloop.looptree.latency.memory.isl import memory_latency
 
 from bindings.looptree import SpatialTag
 
@@ -34,94 +29,6 @@ def compute_latency(mapping, temporal_steps, workload):
     ).to_python()
 
 
-def memory_latency(looptree_results: IslReuseAnalysisOutput,
-                   arch,
-                   mapping,
-                   workload,
-                   bindings):
-    reads, writes = reads_and_writes_from_fill_by_parent(
-        looptree_results.fills,
-        looptree_results.reads_to_parent,
-        mapping,
-        workload,
-        per_unit=True
-    )
-
-    peer_reads, peer_writes = reads_and_writes_from_fill_by_peer(
-        looptree_results.reads_to_peer,
-        mapping,
-        workload,
-        per_unit=True
-    )
-
-    component_to_read_writes = defaultdict(lambda: [None, None])
-    for level, component in bindings.items():
-        read_count = sum(reads[key] for key in reads if key[0] == level)
-        read_count += sum(peer_reads[key]
-                          for key in peer_reads if key[0] == level)
-        write_count = sum(writes[key] for key in writes if key[0] == level)
-        write_count += sum(peer_writes[key]
-                           for key in peer_writes if key[0] == level)
-        if component not in component_to_read_writes:
-            component_to_read_writes[component][0] = read_count
-            component_to_read_writes[component][1] = write_count
-        else:
-            component_to_read_writes[component][0] += read_count
-            component_to_read_writes[component][1] += write_count
-
-    component_latency = {}
-    bandwidths = get_bandwidth(arch)
-    for component, (reads, writes) in component_to_read_writes.items():
-        read_bw, write_bw, shared_bw = bandwidths[component]
-
-        # For numerical stability
-        read_bw += 1e-8
-        write_bw += 1e-8
-        shared_bw += 1e-8
-
-        # All shared bw for writing
-        write_latency = writes / (write_bw + shared_bw)
-        read_latency = reads / read_bw
-        if write_latency >= read_latency:
-            component_latency[component] = write_latency
-            continue
-        # All shared bw for reading
-        write_latency = writes / write_bw
-        read_latency = reads / (read_bw + shared_bw)
-        if read_latency >= write_latency:
-            component_latency[component] = read_latency
-            continue
-        # Shared bw shared for reading and writing
-        component_latency[component] = (
-            (reads + writes)
-            / 
-            (read_bw + write_bw + shared_bw)
-        )
-    return component_latency
-
-
-def get_bandwidth(arch):
-    component_bandwidths = {}
-    for node in arch['nodes']:
-        attributes = node.attributes
-        n_rd_ports = attributes.get('n_rd_ports', 0)
-        n_wr_ports = attributes.get('n_wr_ports', 0)
-        n_rdwr_ports = attributes.get('n_rdwr_ports', 0)
-        if n_rd_ports + n_wr_ports + n_rdwr_ports < 1:
-            n_rdwr_ports = 1
-
-        width = attributes['width']
-        datawidth = attributes['datawidth']
-        width_in_words = width/datawidth
-
-        component_bandwidths[node['name']] = [
-            n_rd_ports*width_in_words,
-            n_wr_ports*width_in_words,
-            n_rdwr_ports*width_in_words
-        ]
-    return component_bandwidths
-
-
 def _compute_latency(mapping, top_idx: int, temporal_steps, workload):
     einsum_name_to_id = workload.einsum_name_to_id()
 
 
@@ -0,0 +1,31 @@
+from typing import overload
+
+from pytimeloop.looptree.reuse.isl.des import IslReuseAnalysisOutput
+from pytimeloop.looptree.latency.memory import isl
+
+
+ANALYSIS_TYPE_TO_ANALYZER = {
+    IslReuseAnalysisOutput: isl.memory_latency,
+    SummarizedAnalysisOutput: summarized.memory_latency
+}
+
+
+@overload
+def calculate_memory_latency(reuse_analysis: IslReuseAnalysisOutput,
+                             architecture,
+                             mapping,
+                             workload,
+                             bindings):
+    pass
+@overload
+def calculate_memory_latency(reuse_analysis: SummarizedAnalysisOutput,
+                             architecture,
+                             mapping,
+                             workload,
+                             bindings):
+    pass
+def calculate_memory_latency(reuse_analysis,
+                             architecture,
+                             mapping,
+                             workload,
+                             bindings):
@@ -0,0 +1,96 @@
+from collections import defaultdict
+
+from pytimeloop.looptree.accesses import (
+    reads_and_writes_from_fill_by_parent,
+    reads_and_writes_from_fill_by_peer
+)
+from pytimeloop.looptree.reuse.isl.des import IslReuseAnalysisOutput
+
+
+def memory_latency(looptree_results: IslReuseAnalysisOutput,
+                   arch,
+                   mapping,
+                   workload,
+                   bindings):
+    reads, writes = reads_and_writes_from_fill_by_parent(
+        looptree_results.fills,
+        looptree_results.reads_to_parent,
+        mapping,
+        workload,
+        per_unit=True
+    )
+
+    peer_reads, peer_writes = reads_and_writes_from_fill_by_peer(
+        looptree_results.reads_to_peer,
+        mapping,
+        workload,
+        per_unit=True
+    )
+
+    component_to_read_writes = defaultdict(lambda: [None, None])
+    for level, component in bindings.items():
+        read_count = sum(reads[key] for key in reads if key[0] == level)
+        read_count += sum(peer_reads[key]
+                          for key in peer_reads if key[0] == level)
+        write_count = sum(writes[key] for key in writes if key[0] == level)
+        write_count += sum(peer_writes[key]
+                           for key in peer_writes if key[0] == level)
+        if component not in component_to_read_writes:
+            component_to_read_writes[component][0] = read_count
+            component_to_read_writes[component][1] = write_count
+        else:
+            component_to_read_writes[component][0] += read_count
+            component_to_read_writes[component][1] += write_count
+
+    component_latency = {}
+    bandwidths = get_bandwidth(arch)
+    for component, (reads, writes) in component_to_read_writes.items():
+        read_bw, write_bw, shared_bw = bandwidths[component]
+
+        # For numerical stability
+        read_bw += 1e-8
+        write_bw += 1e-8
+        shared_bw += 1e-8
+
+        # All shared bw for writing
+        write_latency = writes / (write_bw + shared_bw)
+        read_latency = reads / read_bw
+        if write_latency >= read_latency:
+            component_latency[component] = write_latency
+            continue
+        # All shared bw for reading
+        write_latency = writes / write_bw
+        read_latency = reads / (read_bw + shared_bw)
+        if read_latency >= write_latency:
+            component_latency[component] = read_latency
+            continue
+        # Shared bw shared for reading and writing
+        component_latency[component] = (
+            (reads + writes)
+            / 
+            (read_bw + write_bw + shared_bw)
+        )
+    return component_latency
+
+
+def get_bandwidth(arch):
+    component_bandwidths = {}
+    for node in arch['nodes']:
+        attributes = node.attributes
+        n_rd_ports = attributes.get('n_rd_ports', 0)
+        n_wr_ports = attributes.get('n_wr_ports', 0)
+        n_rdwr_ports = attributes.get('n_rdwr_ports', 0)
+        if n_rd_ports + n_wr_ports + n_rdwr_ports < 1:
+            n_rdwr_ports = 1
+
+        width = attributes['width']
+        datawidth = attributes['datawidth']
+        width_in_words = width/datawidth
+
+        component_bandwidths[node['name']] = [
+            n_rd_ports*width_in_words,
+            n_wr_ports*width_in_words,
+            n_rdwr_ports*width_in_words
+        ]
+    return component_bandwidths
+
@@ -0,0 +1,6 @@
+def memory_latency(looptree_results,
+                   arch,
+                   mapping,
+                   workload,
+                   bindings):
+    raise NotImplementedError()
@@ -0,0 +1,14 @@
+import sympy
+
+
+def lambdify(d, tile_shapes):
+    if isinstance(next(iter(d.values())), tuple):
+        return {
+            k: (v[0], sympy.lambdify(tile_shapes, v[1]))
+            for k, v in d.items()
+        }
+    else:
+        return {
+            k: sympy.lambdify(tile_shapes, v)
+            for k, v in d.items()
+        }