日本語 |English
A user-friendly desktop application for quickly and efficiently searching through PDF file contents. Using indexing technology, you can rapidly find the information you need across multiple PDF documents.
- Fast Search: Instantly display search results using indexing
- Flexible Search Options:
- Fuzzy search (multiple keywords)
- Exact match search
- Subfolder search
- Automatic Indexing: Automatically detect and index new or updated PDF files
- Filename Exclusion: Exclude PDF files with specific text patterns in their filenames from search
- Context Display: View the text surrounding your search keywords
- Save Results: Export search results as a text file
- Easy Configuration: Set up search folders and index DB location via an intuitive UI
[Insert application screenshots here]
- Python 3.7 or higher
- The following Python libraries:
- tkinter
- pdfplumber
- pypdf
# Clone the repository
git clone https://github.com/yourusername/pdf_indexer_searcher.git
cd pdf_indexer_searcher
# Install required libraries
pip install -r requirements.txt
# Run the application
python pdf_indexer_searcher.py
-
First Launch:
- Select the folder containing your PDF files
- Choose a folder to store the index files
- Optionally configure filename patterns to exclude from search
-
Performing a Search:
- Enter your search terms
- Optionally check "Exact Match Search" or "Include Subfolders" as needed
- Click the "Search" button
-
Viewing Results:
- Select a file from the list on the left
- View file details and context on the right
- Double-click or press Enter on a selected file to open the PDF
-
Saving Results:
- Click "Save Results" to save a list of matching filenames to your desktop
- From the Settings menu, you can modify:
- PDF search folder
- Index DB folder
- Exclusion patterns
- Subfolder indexing options
This application:
- Extracts text from PDF files in the specified folder
- Stores the extracted text in a SQLite database
- Executes fast searches against the search query
- Displays search results in real-time
Released under the MIT License. See the LICENSE file for details.
Contributions of all kinds are welcome, including bug reports, feature requests, and pull requests.
calico_blanket
https://x.com/calico_blanket
I am not a professional developer or software engineer, just a middle-aged woman who is an IT enthusiast. This tool was created as a personal project with significant help from Claude's Sonnet 3.5 and 3.7. If you provide feedback, bug reports, or suggestions, I will sincerely work on improvements with the help of Sonnet and knowledgeable community members. I would appreciate your cooperation in my learning and growth
Note: This application has been tested with Japanese and English PDF files, but may work with documents in other languages as well.
英語 |日本語
PDFファイルの内容を高速かつ効率的に検索するためのデスクトップアプリケーションです。インデックスを活用することで、複数のPDFファイルから必要な情報をすばやく見つけることができます。
- 高速検索: インデックスを使用して瞬時に検索結果を表示
- 柔軟な検索オプション:
- あいまい検索(複数キーワード)
- 完全一致検索
- サブフォルダー検索
- 自動インデックス作成: 新規・更新されたPDFファイルを自動検知してインデックスを更新
- ファイル名除外機能: ファイル名に特定のテキストパターンを含むPDFを検索対象から除外可能
- 検索コンテキスト表示: 検索キーワードの前後のテキストを表示
- 結果の保存: 検索結果一覧をテキストファイルとして保存可能
- 簡単な設定: 直感的なUIで検索対象フォルダーとインデックスDBフォルダーを設定
- Python 3.7以上
- 以下のPythonライブラリ:
- tkinter
- pdfplumber
- pypdf
# リポジトリのクローン
git clone https://github.com/calico-blanket/pdf-search.git
cd pdf-search
# 必要なライブラリのインストール
pip install -r requirements.txt
# アプリケーションの実行
python pdf_indepdf-search.py
-
初回起動時:
- PDFファイルが格納されているフォルダーを選択
- インデックスファイルを保存するフォルダーを選択
- 必要に応じて検索から除外したいファイル名パターンを設定
-
検索の実行:
- 検索語を入力
- 必要に応じて「完全一致検索」や「サブフォルダーも検索する」オプションを選択
- 「検索」ボタンをクリック
-
結果の閲覧:
- 左側のリストから見たいファイルを選択
- 右側に選択したファイルの詳細とコンテキストが表示される
- 選択したファイルをダブルクリックまたはEnterキーを押すとPDFが開く
-
検索結果の保存:
- 「結果を保存」ボタンをクリックすると、デスクトップに検索結果ファイル名の一覧が保存される
- 設定メニューから、以下の設定を変更できます:
- PDF検索フォルダー
- インデックスDBフォルダー
- 検索除外テキスト
- サブフォルダーのインデックス作成オプション
本アプリケーションは以下の処理を行います:
- 指定フォルダー内のPDFファイルからテキストを抽出
- 抽出テキストをSQLiteデータベースに保存
- 検索クエリに対して高速検索を実行
- 検索結果をリアルタイムで表示
MITライセンスの下で公開されています。詳細はLICENSEファイルをご覧ください。
バグ報告、機能リクエスト、プルリクエストなど、あらゆる形の貢献を歓迎します。
calico_blanket (猫柄毛布) https://x.com/calico_blanket
私はプロのデベロッパーやソフトエンジニアではなく、単なる、おばちゃんのIT愛好家にすぎません。 このツールは個人的なプロジェクトとして、ClaudeのSonnet3.7の助けを大きく借りて作成しました。 フィードバック、バグ報告、および提案などをいただきましたら、Sonnetと有識者の皆様のお知恵をお借りして、真摯に改善に取り組みたいと思います。 私の学びと成長ににご協力いただけると幸いです。
注意: このアプリケーションは日本語と英語のPDFファイルでテスト済みですが、他の言語でも動作する可能性があります。