compact some of the input and output cells into one block

kszucs · kszucs · commit 8f48f7df8596 · 2025-07-23T01:09:47.000+02:00
diff --git a/parquet-cdc.md b/parquet-cdc.md
@@ -624,26 +624,23 @@ df = pd.read_json(src)
 
 
 ```python
-dst = "hf://datasets/kszucs/pq/hermes-2.5-cdc.parquet"
-df.to_parquet(dst, use_content_defined_chunking=True)
+>>> dst = "hf://datasets/kszucs/pq/hermes-2.5-cdc.parquet"
+>>> df.to_parquet(dst, use_content_defined_chunking=True)
+New Data Upload: 100%|███████████████████████████████████████████████|  799MB /  799MB,  197kB/s  
+Total Bytes:  799M
+Total Transfer:  799M
 ```
 
-    New Data Upload: 100%|███████████████████████████████████████████████|  799MB /  799MB,  197kB/s  
-    Total Bytes:  799M
-    Total Transfer:  799M
-
-
 
 ```python
-short_df = df[[len(c) < 10 for c in df.conversations]]
-short_dst = "hf://datasets/kszucs/pq/hermes-2.5-cdc-short.parquet"
-short_df.to_parquet(short_dst, use_content_defined_chunking=True)
+>>> short_df = df[[len(c) < 10 for c in df.conversations]]
+>>> short_dst = "hf://datasets/kszucs/pq/hermes-2.5-cdc-short.parquet"
+>>> short_df.to_parquet(short_dst, use_content_defined_chunking=True)
+New Data Upload: 100%|███████████████████████████████████████████████| 21.9MB / 21.9MB, 45.4kB/s  
+Total Bytes:  801M
+Total Transfer:  21.9M
 ```
 
-    New Data Upload: 100%|███████████████████████████████████████████████| 21.9MB / 21.9MB, 45.4kB/s  
-    Total Bytes:  801M
-    Total Transfer:  21.9M
-
 
 
 ```python