Use OpenAI API

Betree · Betree · commit 816b5e3db566 · 2024-07-17T15:11:30.000+02:00
diff --git a/apps/cf/config/config.exs b/apps/cf/config/config.exs
@@ -44,4 +44,8 @@ config :algoliax,
 import_config "#{Mix.env()}.exs"
 
 config :cf,
-  openai_api_url: "https://api.perplexity.ai"
+  openai_model: "gpt-4o"
+
+config :openai,
+  beta: "assistants=v2",
+  http_options: [recv_timeout: 30_000, timeout: 30_000]
diff --git a/apps/cf/lib/llms/statements_creator.ex b/apps/cf/lib/llms/statements_creator.ex
@@ -7,25 +7,7 @@ defmodule CF.LLMs.StatementsCreator do
   require EEx
   require Logger
 
-  @max_caption_length 1000
-
-  @model_lama_3_small %{
-    name: "llama-3-sonar-small-32k-chat",
-    parameter_count: "8B",
-    context_length: 32768
-  }
-
-  @model_lama_3_large %{
-    name: "llama-3-sonar-large-32k-chat",
-    parameter_count: "70B",
-    context_length: 32768
-  }
-
-  @model_mistral_7b %{
-    name: "mistral-7b-instruct",
-    parameter_count: "8x7B",
-    context_length: 16384
-  }
+  @captions_chunk_size 300
 
   # Load prompt messages templates
   EEx.function_from_file(
@@ -78,78 +60,44 @@ defmodule CF.LLMs.StatementsCreator do
   Chunk captions everytime we reach the max caption length
   """
   defp chunk_captions(captions) do
-    # TODO: Base on strings lengths + @max_caption_length
-    Enum.chunk_every(captions, 50)
+    # TODO: Add last captions from previous batch to preserve context
+    Enum.chunk_every(captions, @captions_chunk_size)
   end
 
   defp get_llm_suggested_statements(video, captions, retries \\ 0) do
-    api_key = Application.get_env(:cf, :openai_api_key)
-    api_url = Application.get_env(:cf, :openai_api_url)
-
-    unless api_key && api_url do
-      raise "OpenAI API configuration missing"
-    end
-
-    try do
-      headers = [
-        {"Authorization", "Bearer #{api_key}"},
-        {"Content-Type", "application/json"},
-        {"Accept", "application/json"}
-      ]
-
-      system_prompt = generate_system_prompt()
-      user_prompt = generate_user_prompt(video, captions)
-
-      body =
+    OpenAI.chat_completion(
+      model: Application.get_env(:cf, :openai_model),
+      response_format: %{type: "json_object"},
+      stream: false,
+      messages: [
+        %{
+          role: "system",
+          content: generate_system_prompt()
+        },
         %{
-          "model" => @model_lama_3_large[:name],
-          "max_tokens" =>
-            @model_lama_3_large[:context_length] -
-              String.length(system_prompt) - String.length(user_prompt) - 500,
-          "stream" => false,
-          "messages" => [
-            %{
-              "role" => "system",
-              "content" => system_prompt
-            },
-            %{
-              "role" => "user",
-              "content" => user_prompt
-            }
-          ]
+          role: "user",
+          content: generate_user_prompt(video, captions)
         }
-        |> Jason.encode!()
-
-      case HTTPoison.post("#{api_url}/chat/completions", body, headers,
-             timeout: 30_000,
-             recv_timeout: 30_000
-           ) do
-        {:ok, %HTTPoison.Response{status_code: 200, body: body}} ->
-          body
-          |> Jason.decode!()
-          |> Map.get("choices")
-          |> List.first()
-          |> get_in(["message", "content"])
-          |> get_json_str_from_content!()
-          |> Jason.decode!()
-          |> Map.get("statements")
-          |> check_statements_input_format!()
-
-        {:ok, %HTTPoison.Response{status_code: status_code, body: body}} ->
-          raise "Network error: #{status_code} - #{inspect(body)}"
-
-        {:error, %HTTPoison.Error{reason: reason}} ->
-          raise inspect(reason)
-      end
-    rescue
-      error ->
+      ]
+    )
+    |> case do
+      {:ok, %{choices: choices}} ->
+        choices
+        |> List.first()
+        |> get_in(["message", "content"])
+        |> get_json_str_from_content!()
+        |> Jason.decode!()
+        |> Map.get("statements")
+        |> check_statements_input_format!()
+
+      {:error, error} ->
         if retries > 0 do
           Logger.warn("Failed to get LLM suggested statements: #{inspect(error)}. Retrying...")
           Process.sleep(1000)
           get_llm_suggested_statements(video, captions, retries - 1)
         else
           Logger.error(inspect(error))
-          reraise error, __STACKTRACE__
+          raise error
         end
     end
   end
diff --git a/apps/cf/lib/llms/templates/statements_extractor_system_prompt.eex b/apps/cf/lib/llms/templates/statements_extractor_system_prompt.eex
@@ -9,13 +9,15 @@ Renvoie uniquement le résultat en JSON, **sans aucun commentaire ni conclusion*
 Pour être pertinente, une citation doit :
 - être vérifiable grâce à l'exposition de faits
 - faire mention d'une source ou d'un contenu que l'on peut vérifier
+- présenter une information unique (découpe les citations qui présentent plusieurs éléments)
 Et remplir au moins un des critères suivants :
 - présenter des éléments incomplets ou approximatifs
 - présenter un argument fallacieux, trompeur ou mensonger
 - présenter des informations intéressantes à vérifier
 
 Ne méritent pas travail de vérification :
 - les évidences comme "Le ciel est bleu !"
+- les annecdotes personelles (ex: "ça a changé ma vie")
 - les figures de style et l'humour (comme les hyperboles, les métaphores, etc)
 - les erreurs mineures
 - les opinions personnelles ("j'aime ça")
@@ -30,11 +32,12 @@ Ne méritent pas travail de vérification :
     "title": "Thinkerview - La diagonale du vide en France"
   },
   "captions": [
-    { "start": 10, "text": "Cette mesure sociale a été un désastre de la pensée ça ne m'évoque que du dégoût elle n'a fait que créer une augmentation du chômage, c'est pour moi une pure folie" },
-    { "start": 85, "text": "il y a d'autres zones en France qui sont très peuplées elle s'affiche ici et juste là et oui je sais effectivement je pense que je peux tenter une" },
+    { "start": 10, "text": "Cette mesure sociale a été un désastre de la pensée ça ne m'évoque que du dégoût elle n'a fait que créer une augmentation du chômage et a provoqué de nombreuses critiques de l'UE c'était pour moi une pure folie" },
+    { "start": 85, "text": "mais parlons de la diagonnale du vite il y a d'autres zones en France qui sont très peuplées elle s'affiche ici et juste là et oui je sais effectivement je pense que je peux tenter une" },
     { "start": 89, "text": "reconversion à devenir présentateur météo" },
     { "start": 94, "text": "dans les zones que vous voyez ici on compte seulement 6,5% de la population française métropolitaine pourtant et bien ces espaces" },
-    { "start": 102, "text": "représentent 42% du territoire national mais alors pourquoi la diagonale du vide comme" }
+    { "start": 102, "text": "représentent 42% du territoire national mais alors pourquoi la diagonale du vide comme" },
+    { "start": 110, "text": "nom? Ça a changé ma vie quand je l'ai découvert" }
   ]
 }
 ```
@@ -45,6 +48,7 @@ Ne méritent pas travail de vérification :
 {
   "statements": [
     { "time": 10, "text": "Cette mesure sociale [...] n'a fait que créer une augmentation du chômage" },
+    { "time": 10, "text": "Cette mesure sociale [...] a provoqué de nombreuses critiques de l'UE" },
     { "time": 94, "text": "ici on compte seulement 6,5% de la population française métropolitaine" },
     { "time": 94, "text": "ces espaces représentent 42% du territoire national" }
   ],
diff --git a/apps/cf/mix.exs b/apps/cf/mix.exs
@@ -59,6 +59,7 @@ defmodule CF.Mixfile do
       {:burnex, "~> 3.1"},
       {:yaml_elixir, "~> 2.9.0"},
       {:jason, "~> 1.4"},
+      {:openai, "~> 0.6.1"},
 
       # ---- Internal ----
       {:db, in_umbrella: true},
diff --git a/apps/cf_graphql/lib/schema/schema.ex b/apps/cf_graphql/lib/schema/schema.ex
@@ -90,7 +90,6 @@ defmodule CF.Graphql.Schema do
       resolve(&Resolvers.Notifications.update_subscription/3)
     end
 
-    # startAutomaticStatementsExtraction
     @desc "Use this to start the automatic statements extraction job. Requires elevated permissions."
     field :start_automatic_statements_extraction, :video do
       middleware(Middleware.RequireAuthentication)
diff --git a/config/releases.exs b/config/releases.exs
@@ -87,8 +87,7 @@ config :cf,
   hard_limitations_period: load_int.({"hard_limitations_period", 3 * 60 * 60}),
   invitation_system: load_bool.({"invitation_system", "false"}),
   youtube_api_key: load_secret.({"youtube_api_key", nil}),
-  openai_api_key: load_secret.("openai_api_key"),
-  openai_api_url: load_secret.("openai_api_url", "https://api.perplexity.ai"),
+  openai_model: load_secret.("openai_model"),
   oauth: [
     facebook: [
       client_id: load_secret.("facebook_app_id"),
@@ -97,6 +96,10 @@ config :cf,
     ]
   ]
 
+config :openai,
+  api_key: load_secret.("openai_api_key"),
+  organization_key: load_secret("openai_organization_key")
+
 config :cf, CF.Authenticator.GuardianImpl, secret_key: load_secret.("secret_key_base")
 
 config :cf, CF.Mailer,
diff --git a/mix.lock b/mix.lock
@@ -78,6 +78,7 @@
   "nimble_pool": {:hex, :nimble_pool, "1.1.0", "bf9c29fbdcba3564a8b800d1eeb5a3c58f36e1e11d7b7fb2e084a643f645f06b", [:mix], [], "hexpm", "af2e4e6b34197db81f7aad230c1118eac993acc0dae6bc83bac0126d4ae0813a"},
   "not_qwerty123": {:hex, :not_qwerty123, "2.2.1", "656e940159517f2d2f07ea0bb14e4ad376d176b5f4de07115e7a64902b5e13e3", [:mix], [{:gettext, "~> 0.13", [hex: :gettext, repo: "hexpm", optional: false]}], "hexpm", "7637173b09eb7b26b29925039d5b92f7107c94a27cbe4d2ba8efb8b84d060c4b"},
   "oauth2": {:hex, :oauth2, "0.9.4", "632e8e8826a45e33ac2ea5ac66dcc019ba6bb5a0d2ba77e342d33e3b7b252c6e", [:mix], [{:hackney, "~> 1.7", [hex: :hackney, repo: "hexpm", optional: false]}], "hexpm", "407c6b9f60aa0d01b915e2347dc6be78adca706a37f0c530808942da3b62e7af"},
+  "openai": {:hex, :openai, "0.6.1", "ad86b5b253969fe6d59896d295b1a573cbe44d586fd00bfa8cf3f440d800b4d6", [:mix], [{:httpoison, "~> 2.0", [hex: :httpoison, repo: "hexpm", optional: false]}, {:jason, "~> 1.4", [hex: :jason, repo: "hexpm", optional: false]}], "hexpm", "aea82953ea82fcbf91d0474125943becf5d8318af53081ed722a0f26d4346353"},
   "parallel_stream": {:hex, :parallel_stream, "1.0.6", "b967be2b23f0f6787fab7ed681b4c45a215a81481fb62b01a5b750fa8f30f76c", [:mix], [], "hexpm", "639b2e8749e11b87b9eb42f2ad325d161c170b39b288ac8d04c4f31f8f0823eb"},
   "parse_trans": {:hex, :parse_trans, "3.4.1", "6e6aa8167cb44cc8f39441d05193be6e6f4e7c2946cb2759f015f8c56b76e5ff", [:rebar3], [], "hexpm", "620a406ce75dada827b82e453c19cf06776be266f5a67cff34e1ef2cbb60e49a"},
   "phoenix": {:hex, :phoenix, "1.5.14", "2d5db884be496eefa5157505ec0134e66187cb416c072272420c5509d67bf808", [:mix], [{:jason, "~> 1.0", [hex: :jason, repo: "hexpm", optional: true]}, {:phoenix_html, "~> 2.13 or ~> 3.0", [hex: :phoenix_html, repo: "hexpm", optional: true]}, {:phoenix_pubsub, "~> 2.0", [hex: :phoenix_pubsub, repo: "hexpm", optional: false]}, {:plug, "~> 1.10", [hex: :plug, repo: "hexpm", optional: false]}, {:plug_cowboy, "~> 1.0 or ~> 2.2", [hex: :plug_cowboy, repo: "hexpm", optional: true]}, {:plug_crypto, "~> 1.1.2 or ~> 1.2", [hex: :plug_crypto, repo: "hexpm", optional: false]}, {:telemetry, "~> 0.4 or ~> 1.0", [hex: :telemetry, repo: "hexpm", optional: false]}], "hexpm", "207f1aa5520320cbb7940d7ff2dde2342162cf513875848f88249ea0ba02fef7"},