Preview

Advanced Engineering Research (Rostov-on-Don)

Расширенный поиск

Автоматизация распределения информации в адаптивных системах электронного документооборота с применением машинного обучения

https://doi.org/10.23947/2687-1653-2020-20-4-430-436

Аннотация

Введение. Системы электронного документооборота (СЭД) используются для хранения, обработки и передачи больших объемов информации. Автоматизация данных процессов является актуальной проблемой, требующей комплексного решения. Ее решение позволит снизить временные и материальные затраты на проектирование и осуществить переход к более совершенным, адаптивным СЭД. Статья посвящена разработке новых методов автоматизации процесса распределения информации в СЭД.

Целью работы является повышение точности распределения информации в СЭД за счет перехода от аналитических или алгоритмических решений к использованию новых методов, функционирующих на основе технологий машинного обучения. Использование нейронных сетей для достижения поставленной цели также позволит повысить эффективность разработки программного обеспечения за счет автоматизации процессов анализа и обработки информации.

Материалы и методы. Предложен новый метод автоматизированного распределения информации на основе технологий машинного обучения, включающий математическое описание правил распределения информации. Сформулированный перечень условий распределения информации позволяет реализовать программное обеспечение на основе нейронных сетей для решения задачи автоматического распределения данных в СЭД.

Результаты исследования. Метод автоматизированного распределения информации апробирован на примере предметной области СЭД при решении задачи анализа правильности информации, введенной пользователем. В ходе экспериментальных исследований получено, что предложенный метод, функционирующий на основе технологий машинного обучения, обеспечивает лучшую точность (на 8 % выше) и более эффективен (в соответствии с метриками Джилба и цикломатической сложности)

Обсуждение и заключения. Полученные результаты подтверждают эффективность и точность предложенного метода. Представленные результаты могут использоваться для автоматизации процессов распределения и проверки информации в адаптивных СЭД, а также других информационных системах. На основе разработанного метода также возможно решение связанных задач: поиск дубликатов и похожих документов, классификация и размещение по категориям файлов.

Об авторе

А. Д. Обухов
ФГБОУ ВО Тамбовский государственный технический университет
Россия

Обухов Артем Дмитриевич - доцент кафедры Системы автоматизированной поддержки принятия решений, кандидат технических наук, доцент, ResearcherID: M-9836-2019, ScopusID: 56104232400.

392000, Тамбов, ул. Советская, 106



Список литературы

1. Кузнецова, Е. В. Актуальные проблемы электронного документооборота в органах власти / Е. В. Кузнецова // Вопросы управления. — 2013. — №. 4. — С. 73-77.

2. Zhong, R. Y. Intelligent manufacturing in the context of industry 4.0: a review / R. Y. Zhong [et al.] // Engineering. — 2017. —Vol. 3 (5). — P. 616-630. DOI: 10.1016/J.ENG.2017.05.015

3. Xu, D. Enhancing e-learning effectiveness using an intelligent agent-supported personalized virtual learning environment: An empirical investigation / D. Xu [et al.] // Information & Management. — 2014. — Vol. 51 (4). — P. 430-440. DOI:10.1016/j.im.2014.02.009

4. Кузнецов, С. Д. Распределенные горизонтально масштабируемые решения для управления данными / С. Д. Кузнецов, А. В. Посконин // Труды Института системного программирования РАН. — 2013. — Т. 24. — С. 327-358.

5. Сравнительный анализ методов машинного обучения для решения задачи классификации документов научно-образовательного учреждения / М. Н. Краснянский, А. Д. Обухов, Е. М. Соломатина, А. А. Воякина // Вестник ВГУ, Серия : Системный анализ и информационные технологии. — 2018. — № 3. — С. 173-182.

6. Karampidis, K. File type identification-computational intelligence for digital forensics / K. Karampidis, G. Papadourakis // Journal of Digital Forensics, Security and Law. — 2017. — Vol. 12 (2). — P. 6. DOI: 10.15394/jdfsl.2017.1472

7. Kim, D. Multi-co-training for document classification using various document representations: TF-IDF, LDA, and Doc2Vec / D. Kim [et al.] // Information Sciences. — 2019. — Vol. 477. — P. 15-29.

8. Zheng, J. Hierarchical neural representation for document classification / J. Zheng [et al.] // Cognitive Computation. — 2019. — Vol. 11 (2). — P. 317-327. DOI:10.1007/s12559-018-9621-6

9. Bodstrom, T. State of the art literature review on network anomaly detection with deep learning / T. Bodstrom, T. Hamalainen // In book: Internet of Things, Smart Spaces, and Next Generation Networks and Systems. Springer, Cham, 2018. — P. 64-76. DOI: 10.1007/978-3-030-01168-0_7

10. Datta, S. Near-Bayesian support vector machines for imbalanced data classification with equal or unequal misclassification costs / S. Datta, S. Das // Neural Networks. — 2015. — Vol. 70. — P. 39-52. DOI: 10.1016/j.neunet.2015.06.005

11. Irolla, P. The duplication issue within the Drebin dataset / P. Irolla, A. Dey // Journal of Computer Virology and Hacking Techniques. — 2018. — Vol. 14 (3). — P. 245-249. DOI: 10.1007/s11416-018-0316-z

12. Goldberg, Y. Neural network methods for natural language processing / Y. Goldberg // Synthesis Lectures on Human Language Technologies. — 2017. — Vol. 10 (1). — P. 1-309. DOI: 10.2200/S00762ED1V01Y201703HLT037

13. Beleites, C. Sample size planning for classification models / C. Beleites [et al.] // Analytica chimica acta. — 2013. — Vol. 760. — P. 25-33. DOI:10.1016/j.aca.2012.11.007

14. Obukhov, A. Algorithm of adaptation of electronic document management system based on machine learning technology / A. Obukhov, M. Krasnyanskiy, M. Nikolyukin // Progress in Artificial Intelligence. — 2020. — Vol. 9. — P. 287-303. DOI: 10.1007/s13748-020-00214-2

15. Bazgir, O. Representation of features as images with neighborhood dependencies for compatibility with convolutional neural networks / O. Bazgir [et al.] // Nature Communications. — 2020. — Vol. 11 (1). — P. 1-13. DOI: 10.1038/s41467-020-18197-y

16. Luo, A. A Structural Complexity Metric Method for Complex Information Systems / A. Luo [et al.] // JSW. — 2019. — Vol. 14 (7). — P. 332-339. DOI: 10.17706/jsw.14.7.332-339

17. Смирнов, А. В. Методы оценки и управления качеством программного обеспечения / А. В. Смирнов // Известия СПбГЭТУ «ЛЭТИ». — 2019. — № 2. — С. 20-25.


Рецензия

Для цитирования:


Обухов А.Д. Автоматизация распределения информации в адаптивных системах электронного документооборота с применением машинного обучения. Advanced Engineering Research (Rostov-on-Don). 2020;20(4):430-436. https://doi.org/10.23947/2687-1653-2020-20-4-430-436

For citation:


Obukhov A.D. Automation of information distribution in adaptive electronic document management systems using machine learning. Advanced Engineering Research (Rostov-on-Don). 2020;20(4):430-436. https://doi.org/10.23947/2687-1653-2020-20-4-430-436

Просмотров: 677


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2687-1653 (Online)