Skip to content

lequangkhai06/crawl-diem-thptqg

Repository files navigation

crawl-diem-thptqg

Mô tả đề tài

Dự án này cào dữ liệu điểm thi THPTQG 2024 từ trang web chính thức. Nó giúp bạn thu thập dữ liệu, phân tích và xử lý để có được cái nhìn rõ hơn về kết quả thi.

Yêu cầu

  • Cài đặt phiên bản Python mới nhất
  • Các thư viện cần thiết (cài bằng pip install -r requirements.txt):
    • requests
    • pandas

Cách sử dụng

Bước 1: Clone repo

git clone https://github.com/lequangkhai06/crawl-diem-thptqg.git
cd crawl-diem-thptqg

Bước 2: Cài đặt thư viện phụ thuộc

pip install -r requirements.txt

Bước 3: Cấu hình

Chỉnh sửa file config.json để thay đổi các thông tin:

  • cityCode: Mã tỉnh.
  • year: Năm.
  • maxRange: Giới hạn tối đa.
  • fileName: Tên file đầu ra lưu điểm (CSV).

Bước 4: Chạy chương trình

python main.py

Kết quả sẽ được lưu trong file CSV mà bạn cấu hình ở bước trước.

Cấu trúc dự án

crawl-diem-thptqg/
├── main.py         # File chính để chạy chương trình
├── sort.py         # Hàm sắp xếp dữ liệu
├── config.json     # File cấu hình
├── requirements.txt# Danh sách các thư viện cần thiết
├── README.md       # File hướng dẫn (file này)

Lưu ý

  • Hãy đảm bảo rằng bạn tuân thủ các quy định pháp luật và chính sách bảo mật của trang web mà bạn cào dữ liệu.
  • Đề xuất dùng với mục đích học thuật hoặc phân tích cá nhân, không sử dụng cho mục đích thương mại.

Đóng góp

Nếu bạn muốn đóng góp vào dự án, hãy tạo Pull Request hoặc gửi issue để trao đổi ý kiến.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages