INPUTING STUDENTS’ SCORE BASED ON GIST FEATURES, SUPPORT VECTOR MACHINES AND TESSERACT

Main Article Content

Hau Hung Nguyen
Son Thai Nguyen

Abstract

Handwriting recogination plays an important role in data inputing and processing in the practice. This attracts much attention of many researchers in different fields. In this paper, a new algorithm is proposed by basing on GIST features, Support Vector Machines (SVM) and Tesseract for entering the score on students’ transcript form at Soc Trang Vocational College. The algorithm consists of two main works, i.e., recognizing students’code and recogziing handwritten digit. In the proposed algorithm, all regions of interest are determined and extract their dictint features with using tesseract and GIST. Then, these features are classified by SVM mechanism. Experimental results demonstrated that the proposed algorithm obtained high performance with accuracy up to 96,57% for students’ code and 93,55% for Handwritting scores. Average time was 7,9s per one transcript.

Downloads

Download data is not yet available.

Article Details

How to Cite
Nguyen, H. and Nguyen, S. (2020) “INPUTING STUDENTS’ SCORE BASED ON GIST FEATURES, SUPPORT VECTOR MACHINES AND TESSERACT”, The Scientific Journal of Tra Vinh University, 1(41), pp. 77-85. doi: 10.35382/18594816.1.41.2020.646.
Section
Articles

References

[1] Jain G, Ko J. Handwritten Digits Recognition
ECE462. Multimedia Systems, Project Report,
University of Toronto. 2008; 1–3. Available from:
http://individual.utoronto.ca/gauravjain/ECE462-
HandwritingRecognition.pdf [Accessed 25th June
2020]
[2] Đỗ Thanh Nghị, Phạm Nguyên Khang. Nhận dạng ký
tự số viết tay bằng giải thuật máy học. Tạp chí Khoa
học Trường Đại học Cần Thơ. 2013; 27:64–71.
[3] Yann Lecun, Corinna Cortes, Christopher J.C.
Burges. The MNIST database of handwritten digits.
1998. Truy cập từ: http://yann.lecun.com/exdb/mnist/
[Ngày truy cập: 25/6/2020].
[4] Lê Thanh Trúc. Nhận dạng điểm số viết tay phục vụ
công tác lên điểm Phòng Đào tạo Trường Đại học
Tây Đô. Tạp chí Khoa học Trường Đại học Cần Thơ.
2015; 15:79–87.
[5] Võ Ngọc Lợi, Trần Cao Đệ. Nghiên cứu nhận dạng
điểm số viết tay có phần thập phân. Trong Kỉ yếu Hội
thảo toàn quốc về Công nghệ Thông tin. Thành phố
Cần Thơ: NXB Đại học Cần Thơ. 2017.
[6] Oliva A, Torralba A. Modeling the Shape of the
Scene: A Holistic Representation of the Spatial Envelope. International Journal of Computer Vision. 2001;
42(3):145–175.
[7] Do T. N, Pham N. K. Handwritten digit recognition
using GIST descriptors and random oblique decision trees. In The National Foundation for Science
and Technology Development (NAFOSTED) Conference on Information and Computer Science. Springer,
Cham. March, 2014: pp. 1–15.
[8] Vapnik V. N. The Nature of Statistical Learning
Theory. Springer-Verlag. 1995.
[9] Phạm Nguyên Khang, Trần Nguyễn Minh Thư, Đỗ
Thanh Nghị. Điểm danh bằng mặt người với đặc trưng
GIST và máy học véc-tơ hỗ trợ. Trong Kỷ yếu Hội
nghị Quốc gia lần thứ X về Nghiên cứu cơ bản và ứng
dụng Công nghệ Thông tin (FAIR). Đà Nẵng. 2017.
DOI: 10.15625/vap.2017.00019. .
[10] Chang C. C, Lin C. J. LIBSVM: a library for support
vector machines. ACM transactions on intelligent
systems and technology (TIST). 2011; 2(3):1–27.
[11] Tanvir S. H, Khan T. A, Yamin A. B. Evaluation
of Optocal Character Recognition Algorithms and
Feature Extraction Techniques. In The Sixth International Conference on Innovative Computing Technology. 2016: pp.326–331.
[12] Lihang Li. Tesseract Open Source OCR
Engine (main repository). 2019. Truy cập từ:
https://github.com/tesseract-ocr/tesseract [Ngày truy
cập: 30/6/2020].
[13] OpenCV 2.4.13.7. Tài liệu về thư viện
nguồn mở OpenCV. 2019. Truy cập từ:
https://docs.opencv.org/2.4/ [Ngày truy cập:
30/6/2020].
[14] Lihang Li. A simple utility to convert
JPEG to PGM. 2013. Truy cập từ:
https://github.com/hustcalm/jpg2pgm [Ngày truy
cập: 30/6/2020].
[15] Tiangang Song. A simple C++ Wrapper of Lear’s
GIST implementation using OpenCV. 2014. Truy cập
từ: https://github.com/whu-tgsong/LibGIST [Ngày
truy cập: 30/6/2020].