skip to main content

Penerapan OCR dan NLP untuk Otomasi Pengisian Arsip Digital dan Validasi Surat pada PT Nusa Raya Cipta Tbk.

Department of Electrical Engineering, Universitas Diponegoro, Jl. Prof. Sudarto, SH, Tembalang, Semarang, Indonesia 50275, Indonesia

Editor(s): Wahyudi Wahyudi
Open Access Copyright 2025 Transient: Jurnal Ilmiah Teknik Elektro under http://creativecommons.org/licenses/by-nc/4.0.

Citation Format:
Abstract
PT Nusa Raya Cipta Tbk masih menggunakan sistem pengarsipan dokumen secara manual, yang menghambat efisiensi serta aksesibilitas dalam pengelolaan administrasi perusahaan. Untuk mengatasi permasalahan tersebut, penelitian ini bertujuan untuk mengembangkan sistem arsip digital guna meningkatkan efisiensi serta kemudahan akses terhadap dokumen. Sistem yang dikembangkan berbasis Machine Learning dan mengintegrasikan Optical Character Recognition (OCR) untuk mengekstraksi teks dari dokumen fisik, serta Natural Language Processing (NLP) untuk menerjemahkan teks dari Bahasa Indonesia ke Bahasa Inggris secara otomatis. Implementasi OCR dilakukan dengan menyesuaikan konfigurasi serta memanfaatkan regex untuk mendeteksi pola teks tertentu, guna memastikan ekstraksi data yang lebih akurat dan sesuai dengan kebutuhan sistem. Pengembangan sistem menggunakan metode Kanban secara iteratif, memungkinkan fleksibilitas tinggi dalam menyesuaikan perubahan serta penyempurnaan fitur secara berkelanjutan. Proses pengembangan mencakup integrasi OCR dengan regex untuk otomatisasi pengarsipan dokumen dan pemrosesan NLP untuk penerjemahan bahasa. Hasil penelitian ini menunjukkan bahwa sistem arsip digital yang dikembangkan mampu mengubah dokumen fisik menjadi format digital yang dapat diakses, diindeks, dan dianalisis secara optimal. Sistem ini meningkatkan efisiensi pencarian serta pengelolaan dokumen, sehingga mendukung peningkatan produktivitas dan efektivitas dalam administrasi perusahaan.

Note: This article has supplementary file(s).

Fulltext View|Download |  Source Code
Machine Learning Source Code
Subject Source Code; OCR; NLP
Type Source Code
  Download (2MB)    Indexing metadata
Keywords: Digitalisasi Arsip; Optical Character Recognition (OCR); Natural Language Processing (NLP); Machine learning; Penerjemahan Otomatis; Regex; Pengelolaan Dokumen; Kanban

Article Metrics:

Last update:

No citation recorded.

Last update:

No citation recorded.