Hai Công Cụ Hữu Ích Để Lấy Nội Dung Từ Website r.jina.ai và Firecrawl.dev

Thấy hay chia sẻ cho bạn bè…

Không biết có ai trong nhóm từng gặp khó khăn khi muốn lấy nội dung từ một trang web để đưa vào AI phân tích hoặc viết lại như mình trước đây không? Nếu có thì hôm nay mình muốn chia sẻ hai cách mà mình hay dùng để lấy toàn bộ nội dung từ trang web một cách nhanh chóng, không cần kéo chuột hay copy-paste rườm rà nữa.

1. Dùng Miễn Phí Qua Trang r.jina.ai

Cách đầu tiên là sử dụng trang r.jina.ai. Bạn chỉ cần dán link của trang web muốn lấy nội dung vào, sau đó nhấn Enter, công cụ sẽ tự động cào hết văn bản từ trang đó dưới định dạng Markdown. Từ đó, bạn có thể dễ dàng chọn đoạn cần thiết để sao chép, hoặc đơn giản là dùng tổ hợp phím Ctrl + A để chọn tất cả và Ctrl + C để copy toàn bộ nội dung. Sau đó, bạn có thể dán nội dung này vào ChatGPT, Claude, Gemini hoặc bất cứ công cụ AI nào để chúng tiếp tục phân tích hoặc viết lại.

Trang này cũng có phiên bản trả phí nếu bạn muốn sử dụng API để tích hợp tự động, nhưng với người dùng thông thường như mình, cách làm thủ công trên là hoàn toàn miễn phí và rất hiệu quả.

2. Dùng Miễn Phí Qua Firecrawl.dev

Công cụ thứ hai mình hay dùng là Firecrawl.dev. Với Firecrawl, bạn có 500 credit miễn phí, tương đương với 500 trang web. Công cụ này có khả năng cào nội dung sạch từ các trang web để cung cấp cho các mô hình ngôn ngữ lớn (LLM) sử dụng. Điểm mạnh của Firecrawl là ngoài việc cào nội dung từ một trang, nó còn có thể thu thập toàn bộ dữ liệu từ trang web theo cấu trúc chuẩn, giúp các công cụ AI hiểu và xử lý tốt hơn.

Bạn có thể dùng trực tiếp ngay trên trang chủ hoặc chọn tab “PlayGround” để có thêm nhiều tùy chọn khác. Firecrawl cũng cung cấp API cho những ai muốn tự động hóa quy trình, hoặc bạn có thể cài đặt và sử dụng miễn phí bản mã nguồn mở chạy trên máy tính cá nhân.

Cả hai công cụ này đều cho phép bạn lấy nội dung từ web một cách dễ dàng và nhanh chóng, giúp tiết kiệm rất nhiều thời gian trong việc chuẩn bị dữ liệu cho các công cụ AI.

Lời Kết

Mọi người thử xem sao nhé, đây là hai cách mình thường dùng để lấy nội dung từ trang web mà không cần phải kéo chuột hoặc copy thủ công. Nếu bạn có cách nào khác tiện lợi hơn, hãy chia sẻ để mọi người trong nhóm cùng biết với nhé! 😘

About The Author

Leave a Comment

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Scroll to Top