Thứ Hai, 19 tháng 11, 2012

Trích xuất text từ file hình ảnh online

Năm 2007, Hoa súng Santé có đăng một bài viết Trích xuất text từ file hình ảnh không còn là điều khó , nhận thấy bài viết này rất có sức hút với các bạn trẻ có xu hướng tạo ebook từ file scan các cuốn sách được xuất bản trên thị trường. Nhờ công nghệ này mà Hoa Súng Santé cũng đã gửi đến các bạn 2 sản phẩm đó là từ điển triệu chứng và từ điển hội chứng. Trải qua một khoảng thời gian khá dài, rất nhiều trang web hỗ trợ trích xuất text từ file ảnh đã ra đồi tuy nhiên việc hỗ trợ tiếng  Việt vẫn là một công đoạn hết sức gian khó. Người sử dụng cũng bị giời hạn nhiều và cần phải chi trả những dịch vụ cao hơn nêu muốn sử dụng những tính năng chất lượng. Nay Hoa Súng Santé rất vui khi giới thiệu đến các bạn một trang web đã hỗ trợ tốt hơn với tiếng Việt và miễn phí cũng như không giới hạn số tài liệu, files mà bạn sử dụng. Trang web đó là trang www.newocr.com . Sau đây Hoa Súng Santé sẽ hướng dẫn các bạn một số bước để sử dụng ứng dụng tuyệt vời này.

Đầu tiễn vẫn cần các bạn chuẩn bị những file ảnh, file scan có chất lượng về quang học một chút để ứng dụng không bắt nhầm chữ. truy cập vào trang web www.newocr.com



Bước 2 các bạn lựa chọn file hoạc đường link, chọn ngôn Việt Nam, sau đó click vào preview; Sau đó bạn chọn vùng cần trích xuất text trên file ảnh rồi click vào nút OCR.


Thành quả của bạn sẽ xuất hiện trong vài giây, phụ thuộc kích thước file bạn upload.


Chất lượng của nội dung phụ thuộc vào chất lượng file anh mà các bạn upload lên trang web. File mà Hoa Súng Santé upload lên chất lượng hơi kém khiến việc bắt chữ của phần mềm không được tốt. Vì thế sau khi copy vào file word các bạn nên luu ý một chút về chính tả.

Chúc các bạn vui!!!

1 nhận xét: