new generate_dataset.sh (#6423)

* new generate_dataset.sh * keep those there * test: rm expected failures * rename to extract
2024-09-09 15:13:07 +08:00 · 2024-09-09 15:13:07 +08:00 · c5bae55ec8
parent 1941e66cc9
commit c5bae55ec8
5 changed files with 33 additions and 17 deletions
--- a/.github/workflows/test.yml
+++ b/.github/workflows/test.yml
@ -337,8 +337,8 @@ jobs:
      run: PYTHONPATH="." METAL=1 python test/external/external_test_speed_llama.py
    - name: Test Beam Search
      run: PYTHONPATH="." METAL=1 IGNORE_BEAM_CACHE=1 python3 -m pytest extra/optimization/test_beam_search.py
-    - name: Fuzz Test linearizer, TODO fix failure
-      run: PYTHONPATH="." METAL=1 FUZZ_ALL_ACTIONS=1 DEPTH=2 FUZZ_N=24 FUZZ_MAX_SIZE=10000000 python test/external/fuzz_linearizer.py --expected-failures 1
+    - name: Fuzz Test linearizer
+      run: PYTHONPATH="." METAL=1 FUZZ_ALL_ACTIONS=1 DEPTH=2 FUZZ_N=24 FUZZ_MAX_SIZE=10000000 python test/external/fuzz_linearizer.py
    - name: Fuzz Test models schedule
      run: FUZZ_SCHEDULE=1 FUZZ_SCHEDULE_MAX_PATHS=5 python -m pytest test/models/test_train.py test/models/test_end2end.py
    - name: Run TRANSCENDENTAL math
--- a/extra/datasets/sops.gz
+++ b/extra/datasets/sops.gz
--- a/extra/optimization/extract_dataset.py
+++ b/extra/optimization/extract_dataset.py
@ -0,0 +1,22 @@
+#!/usr/bin/env python3
+# extract asts from process replay artifacts
+import os, pickle
+from tinygrad.helpers import db_connection, getenv, VERSION
+from test.external.process_replay.process_replay import _run_differ
+
+PAGE_SIZE = 100
+RUN_ID = os.getenv("GITHUB_RUN_ID", "HEAD")
+TABLE_NAME = f"process_replay_{RUN_ID}_{getenv('GITHUB_RUN_ATTEMPT')}_{VERSION}"
+LOGOPS = os.getenv("LOGOPS", "/tmp/sops")
+
+def extract_ast(offset:int):
+  logops = open(LOGOPS, "a")
+  conn = db_connection()
+  for row in conn.execute(f"SELECT val FROM '{TABLE_NAME}' LIMIT ? OFFSET ?", (PAGE_SIZE, offset)).fetchall():
+    logops.write(str(pickle.loads(row[0])[0]).replace("\n", "").replace(" ", "")+"\n")
+  return False
+
+if __name__ == "__main__":
+  conn = db_connection()
+  row_count = conn.execute(f"SELECT COUNT(*) FROM '{TABLE_NAME}'").fetchone()[0]
+  _run_differ(row_count, extract_ast)
--- a/extra/optimization/generate_dataset.sh
+++ b/extra/optimization/generate_dataset.sh
@ -1,12 +1,10 @@
 #!/bin/bash
-export LOGOPS=/tmp/ops
+export LOGOPS=/tmp/sops
+export RUN_PROCESS_REPLAY=1
 rm $LOGOPS
+test/external/process_replay/reset.py

-# generate many kernels
-PYTHONPATH="." OPT=2 GPU=1 python3 test/external/external_test_opt.py
-PYTHONPATH="." OPT=3 GPU=1 python3 test/external/external_test_opt.py
-GPU=1 IMAGE=1 python3 test/test_ops.py
-FORWARD_ONLY=1 GPU=1 IMAGE=2 python test/test_ops.py
+python3 -m pytest -n=auto test/ --ignore=test/unit --durations=20
 STEPS=3 python3 examples/hlb_cifar10.py
 WINO=1 STEPS=3 python3 examples/hlb_cifar10.py
 python3 examples/stable_diffusion.py --noshow
@ -23,6 +21,7 @@ JIT=2 BIG=1 MPS=1 python -m pytest test/test_gc.py
 JIT=2 BIG=1 MPS=1 python -m pytest test/test_jit.py
 JIT=2 BIG=1 MPS=1 python -m pytest test/test_speed_v_torch.py

-# sort and uniq
-sort -u /tmp/ops > /tmp/sops
-ls -lh /tmp/ops /tmp/sops
+# extract, sort and uniq
+extra/optimization/extract_dataset.py
+sort -u /tmp/ops > /tmp/sops	
+ls -lh /tmp/ops /tmp/sops	
--- a/tinygrad/engine/schedule.py
+++ b/tinygrad/engine/schedule.py
@ -17,9 +17,6 @@ from tinygrad.shape.view import View, strides_for_shape
 # creation can recurse a lot
 sys.setrecursionlimit(10000)

-# optionally log the ops to disk
-logops = open(getenv("LOGOPS", ""), "a") if getenv("LOGOPS", "") else None
-
 # *** ScheduleItem return type ***

@dataclass(frozen=True)
@ -471,9 +468,7 @@ def create_schedule_with_vars(outs:List[LazyBuffer], seen:Optional[Set[LazyBuffe
      for out in lsi.outputs: realized_lazybuffer(out, kernel_number)
    var_vals = merge_dicts([var_vals, lsi.var_vals])
    for out in lsi.outputs: del out.srcs  # can only schedule once
-    schedule.append(si:=ScheduleItem(lsi.ast, tuple(x.buffer for x in lsi.outputs+lsi.inputs if x.size != 0), lsi.metadata))
-    if logops and si.ast.op is UOps.SINK and not any(i.device.startswith("DISK:") for i in si.inputs):
-      logops.write(str(si.ast).replace("\n", "").replace(" ", "")+"\n")
+    schedule.append(ScheduleItem(lsi.ast, tuple(x.buffer for x in lsi.outputs+lsi.inputs if x.size != 0), lsi.metadata))
    for x in graph[lsi]:
      in_degree[x] -= 1
      if in_degree[x] == 0: queue.append(x)