C0untFloyd · gc-pwr · Nov 9, 2024 · Nov 9, 2024
diff --git a/.gitignore b/.gitignore
@@ -6,6 +6,7 @@ __pycache__/
 *.wav
 *.npy
 .vs/
+.idea/
 /models
 /bark_ui_enhanced.egg-info
 /build/lib/bark

diff --git a/bark/hubert/hubert_manager.py b/bark/hubert/hubert_manager.py
@@ -42,6 +42,9 @@ def make_sure_tokenizer_installed(model: str = 'quantifier_hubert_base_ls960_14.
             elif tokenizer_lang == 'pl':
                 repo = 'Hobis/bark-voice-cloning-polish-HuBERT-quantizer'
                 model = 'polish-HuBERT-quantizer_8_epoch.pth'
+            elif tokenizer_lang == 'it':
+                repo = 'gpwr/bark-it-tokenizer'
+                model = 'it_tokenizer.pth'
             else:
                 raise 'Unknown Tokenizer Language!'
             print(f'{local_file} not found. Downloading HuBERT custom tokenizer')

diff --git a/webui.py b/webui.py
@@ -61,12 +61,12 @@ def generate_text_to_speech(text, selected_speaker, text_temp, waveform_temp, eo
     use_last_generation_as_history = "Use last generation as history" in complete_settings
     save_last_generation = "Save generation as Voice" in complete_settings
     for l in range(batchcount):
-        currentseed = seed
+        currentseed = int(seed)
         if seed != None and seed > 2**32 - 1:
             logger.warning(f"Seed {seed} > 2**32 - 1 (max), setting to random")
             currentseed = None
         if currentseed == None or currentseed <= 0:
-            currentseed = np.random.default_rng().integers(1, 2**32 - 1)
+            currentseed = int(np.random.default_rng().integers(1, 2**32 - 1))
         assert(0 < currentseed and currentseed < 2**32)
 
         progress(0, desc="Generating")
@@ -260,7 +260,7 @@ def create_version_html():
 preload_models()
 
 available_themes = ["Default", "gradio/glass", "gradio/monochrome", "gradio/seafoam", "gradio/soft", "gstaff/xkcd", "freddyaboulton/dracula_revamped", "ysharma/steampunk"]
-tokenizer_language_list = ["de","en", "es", "pl"]
+tokenizer_language_list = ["en", "de", "es", "pl", "it"]
 prepare_training_list = ["Step 1: Semantics from Text","Step 2: WAV from Semantics"]
 
 seed = -1
-Original file line number
+Diff line change
@@ Expand Up / @@ -6,6 +6,7 @@ __pycache__/ @@
     *.wav
     *.npy
     .vs/
+    .idea/
     /models
     /bark_ui_enhanced.egg-info
     /build/lib/bark
@@ Expand Down @@