Bài báo cùng quyển |
|---|
Xây dựng công cụ phát hiện bản đồ Việt Nam vi phạm chủ quyền quốc gia trong tài liệu ảnh
Tóm tắt
Thời gian gần đây, dư luận trong nước liên tục phát hiện hình ảnh bản đồ Việt Nam có đường lưỡi bò thể hiện không đúng chủ quyền quốc gia được cài cắm vào trong các tài liệu, ấn phẩm, bộ phim, ứng dụng, trò chơi vi phạm nghiêm trọng pháp luật Việt Nam về chủ quyền biên giới. Điều này, gây rất nhiều khó khăn trong công tác kiểm soát, kiểm duyệt nội dung, hình ảnh và phê duyệt, cấp phép xuất bản tài liệu ấn phẩm của Bộ phận cấp phép xuất bản tài liệu của Sở Thông tin và Truyền thông tỉnh An Giang. Do đó rất cần có một công cụ tự động phát hiện các hình ảnh bản đồ Việt Nam có chứa ảnh đường lưỡi bò trong tài liệu ảnh xin cấp phép xuất bản. Mô hình mạng nơ-ron tích chập (Convolutional Neraul Network - CNN) là một trong những mô hình học sâu phổ biến nhất và có ảnh hưởng nhiều nhất trong lĩnh vực Thị giác máy tính (Computer Vision – CV). CNN được dùng trong trong nhiều bài toán như: phân loại ảnh, phát hiện ảnh, nhận dạng ảnh, phân tích video, hoặc trong lĩnh vực xử lý ngôn ngữ tự nhiên, và hầu hết đều giải quyết tốt các bài toán này. Ưu điểm của các mô hình học sâu là tự động học các đặc trưng của tài liệu ảnh và phát hiện đối tượng trong tài liệu ảnh mà không cần biết trước bố cục cụ thể của tài liệu ảnh. Trong bài báo này chúng tôi nghiên cứu sử dụng CNN với các mô hình VGG16, InceptionV3 và ResNet50 kết hợp học chuyển giao để phát hiện ảnh bản đồ Việt Nam có chứa ảnh đường lưỡi bò trong tài liệu ảnh. Kết quả thực nghiệm đã cho thấy ba mô hình này đều khả thi, tuy nhiên mô hình ResNet50 cho kết quả tốt nhất, thực nghiệm trên tập 2.000 tài liệu ảnh, thì mô hình ResNet50 cho kết quả chính xác trên 95%. Xác suất phát hiện cao của mô hình ResNet50 thể hiện sự phù hợp của mô hình đối và cũng là cơ sở để xây dựng công cụ để triển khai thực tế tại Sở Thông tin và Truyền thông tỉnh An Giang.
Từ khóa: Phân loại ảnh, Mạng nơ-ron tích chập, VGG16, InceptionV3, ResNet50, Học chuyển giao