WWW.OS.X-PDF.RU
БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА - Научные публикации
 

«Аннотация. Рассмотрен подход к поддержке принятия решений в налоговом администрировании на основе нейросетевых моделей. ...»

1

Об одном подходе к принятию решений в налоговом

администрировании на основе нейросетевых моделей с байесовской

регуляризацией

Фархиева Светлана Анатольевна

Старший преподаватель кафедры «Математика и информатика »

Всероссийский заочный финансово-экономический институт, филиал в г.Уфе

ok-xi@yandex.ru

Аннотация. Рассмотрен подход к поддержке принятия решений в

налоговом администрировании на основе нейросетевых моделей. Предложен

приближенный метод байесовской регуляризации нейросетевых моделей подсистем налогового администрирования, которые характеризуются сильным зашумлением (и даже сознательным искажением) данных.

Актуальность темы для практики состоит в том, что она создает научную базу для модернизации системы налогового администрирования в направлении повышения эффективности ее работы и уровня автоматизации.

Ключевые слова: налоговое администрирование, нейронные сети, предобработка, регуляризация, байесовский подход, экспертная система.



Summary. In article the approach to support of decision-making in tax administration on the basis of neuronetwork models is considered. The approximate method of bayesovsky regularization of neuronetwork models of subsystems of tax administration which are characterized by a strong zashumleniye (and even conscious distortion) data is offered. The subject urgency for practice consists that she creates scientific base for modernization of system of tax administration in the direction of increase of efficiency of its work and automation level.

tax administration, neural networks, preprocessing,

Keywords:

regularization, bayesovsky approach, expert system.

В современных условиях развития российской экономики актуальным является максимальное наполнение государственного бюджета доходами и обеспечение их сбалансированности с расходами. В рамках приоритетных направлений совершенствования налоговой системы Российской Федерации, определенных Президентом и Правительством, предусмотрено, что использование эффективных приемов и методов налогового администрирования и дальнейшее их совершенствование должно способствовать значительному росту налоговых поступлений в бюджет.

Поэтому актуальной проблемой исследований представляется совершенствование технологий подсистем налогового администрирования на основе методов и технологий построения нейросетевых моделей поддержки принятия решений в условиях высокой неопределенности данных (существенное искажение данных налоговых деклараций, дефицита наблюдений и т.д.). Это в конечном итоге повысит собираемость налогов с сохранением возможности эффективного функционирования предприятий после уплаты налогов.

В результате анализа известных подходов для поддержки принятия решений в системе налогового администрирования и существующих методик налогового контроля, планирования и регулирования, а также особенностей условий моделирования (сильная зашумленность данных) обоснована необходимость исследования управления процессами в этих подсистемах и разработка нейросетевых моделей для представления знаний в интеллектуальных экспертных системах по принятию решений в системе налогового администрирования.

В целях системного видения процессов в системе налогового администрирования разработана мультиагентная когнитивная карта (модель) (рисунок 1), которая наглядно представляет структуру налоговой системы регионального и муниципального уровней, взаимосвязей потоков информации и финансов между подсистемами. Эта модель позволяет декомпозировать общую задачу моделирования на подмодели агентов, четко очерчивая границы между ними, что облегчает разработку соответствующих подходов и методов с учетом причинно-следственных связей между всеми экономическими агентами. Тем самым уменьшается размерность задач моделирования и предопределяется эффективность нейромоделей.

Рисунок 1. Когнитивная мультиагентная модель финансовых и информационных потоков в бюджетно-налоговой системе регионального и муниципального уровней.

Нейросети по сравнению с традиционными инструментариями эконометрики и прикладной статистики считаются универсальным инструментарием, поскольку нейросетевые модели сохраняют способность работать в сложных условиях моделирования, где традиционные методы теряют работоспособность. Сложные условия моделирования в задачах налогового администрирования, это - прежде всего сильное зашумление данных, зачастую переходящее в сознательное их искажение с целью уменьшения налогооблагаемой базы; дефицит наблюдений, связанный с тем, что бухгалтерская отчетность формируется налогоплательщиками один раз в квартал. То есть имеет место нарушение предпосылок метода наименьших квадратов.

Во всех трех подсистемах налогового администрирования можно выделить в нейросетевых математических моделях общее «ядро» в виде восстанавливаемой параметрической «обобщенной производственной функции» Y ( X,W ), где X – вектор входных факторов, W совокупность оцениваемых параметров (в нейросети – это матрица синаптических весов).

Моделирование такого «ядра» позволяет разработать общую методологию моделирования в нейросетевом базисе для подсистем налогового контроля, налогового планирования и налогового регулирования в виде совокупности методов и алгоритмов [1]. Наглядно взаимосвязь основных моделей и надстроек к ним в системе налогового администрирования показана на рисунке 2.

Рисунок 2. Взаимосвязь математических моделей в подсистемах налогового администрирования В предварительных исследованиях [2] проведен модельный вычислительный эксперимент, в котором показано, что при повышении некоторого критического значения интенсивности шумов и их объема нейросеть теряет устойчивость (малому приращению интенсивности шума соответствуют очень большие приращения ошибки обобщения).





Это обосновывает необходимость предобработки данных и регуляризации нейросетевой модели, то есть повышения устойчивости нейросети к возмущению входных данных. Для практики регуляризация дает повышение достоверности оценок с помощью нейросетевых моделей в тяжелых условиях моделирования.

Предлагается основной подход к регуляризации нейросетевых моделей – байесовский подход [3,4]. Согласно [5] под регуляризацией понимается «сужение» класса допустимых решений. В этой теории для апостериорной оценки вероятности появления данных в соответствии с данной фиксированной гипотезой hq расчет вероятности требует оценки функции правдоподобия в формуле Байеса. Для этого в классической теории [5] построены аналитически соответствующие статистические суммы через оценку функции правдоподобия. Условия применимости принципа максимального правдоподобия классические – шумовая составляющая имеет нормальный закон распределения. В задачах налогового администрирования это не выполняется в силу сознательного искажения данных и других условий, связанных с предпосылками метода наименьших квадратов.

Поэтому предлагается приближенный метод байесовской регуляризации нейросетевых моделей.

Механизм регуляризации при этом состоит в двух операциях:

- сужение класса искомых решений при апостериорной фильтрации h, гипотез-нейросетей т.е. отфильтровываются нейросетевые модели с q неприемлемым качеством объяснения данных;

- осреднение расчетных характеристик на суженном ансамбле отфильтрованных нейросетей.

То есть предлагается приблизить байесовский подход [5] к реальным условиям моделирования, когда априори неизвестен закон распределения шумов.

Сделано это путем введения специального критерия оценки апостериорных вероятностей гипотез hq о порождении данных D:

–  –  –

гипотезы; N - общее число точек, предъявляемых обученной сети.

Предлагаемый приближенный байесовский подход реализован с помощью метода вложенных математических моделей, который включает в себя алгоритмы предпроцессорной обработки данных (предрегуляризация) и алгоритмы байесовской регуляризации обучения сетей и их апостериорной фильтрации. Это позволяет с целью обеспечения состоятельности задачи регуляризации нейросетевой модели процедуры улучшения информативности данных производить взаимосвязано с процедурами байесовской регуляризации, что повышает эффективность байесовской регуляризации обучения нейросети. Логическая схема метода показана на рисунке 3. Метод вложенных математических моделей разработан детально и апробирован в широких сериях вычислительных экспериментов, как в целом, так и в отдельности по каждой процедуре метода [3].

–  –  –

Рисунок 3.

Логическая схема метода вложенных математических моделей Разработка специальных алгоритмов предобработки данных продиктована следующими соображениями:

1. В задачах подсистем налогового администрирования рассматриваются сложные условия моделирования, позволяющие достичь требуемого уровня обобщения в концепциях, методах, алгоритмах и моделях.

В этих условиях роль предобработки данных возрастает.

2. Принципиальное отличие предложенных алгоритмов предобработки данных от традиционных методов математической статистики состоит в том, что предобработка проводится не изолированно от обучения нейросети, а связана с ним, т.е. подчинена качеству будущего обучения. Для этого вводится специальный инструментарий – вспомогательные нейросетевые субмодели.

3. В процедуры предобработки данных вводится процедура байесовской регуляризации на ансамбле нейросетей, поэтому процедуры предобработки данных приобретают черты «предрегуляризации» будущего обучения рабочей нейросети.

Для оценки адекватности нейросетевых моделей нет стройной теории, аналогичной регрессионным методам.

Для теоретической оценки адекватности предложен специальный двухступенчатый метод:

I шаг. Оценка адекватности (ее механизм) скрыта в самом алгоритме регуляризации. А именно, в процедуре фильтрации по апостериорному критерию и последующему осреднению всех расчетных характеристик на отфильтрованном ансамбле сетей.

II шаг. Обоснование адекватности по выходным характеристикам, полученным с помощью нейросетей. А именно, сравниваются синтезированные оптимальные планы выездных налоговых проверок, полученные на каждой сети из отфильтрованного ансамбля нейросетей.

Совпадение этих планов с определенной требуемой вероятностью и служат гарантией оценки адекватности модели.

Причем вторая ступень характеризуется своими интегральными оценками. Она оценивает адекватность после всех процедур предобработки данных, регуляризации и синтеза плана.

Кроме того, адекватность исследовалась в широких сериях вычислительных экспериментов на реальных данных [4].

Предложенный подход прошел проверку на натурных производственных экспериментах по 30 предприятиям одной отрасли. По эти предприятиям были зафиксированы налоговые декларации за 3 года по бухгалтерской отчетности. В 2010г. по предприятиям были проведены выездные налоговые проверки. Сравним результаты моделирования с результатами налоговых проверок, проводившихся на предприятиях, участвовавших в вычислительном эксперименте. В таблице 1 представлены оптимальный план выездных проверок (составленный по критерию отбора на основе байесовского ансамбля нейросетей) и величина налоговых доначислений, полученных по результатам выездных проверок (указаны первые 12 номеров предприятий согласно оптимальному плану и 12 номеров предприятий с наибольшими доначислениями) [4].

Таблица 1 Сравнение результатов моделирования с итогами выездных налоговых проверок Значение № № Доначисления, g предприятия предприятия руб.

11 0.20276 11 7002076 3 0.09776 9 3140252 22 0.07272 8 2780893 9 0.06346 24 1911636 14 0.04393 21 1700531 21 0.02258 22 1520399 8 0.02081 16 1427865 24 0.01875 10 1384382 2 0.01612 13 1371761 12 0.01565 3 1366995 30 0.01513 14 1041774 10 0.01316 2 839696

–  –  –

Библиографический список

1. Нейросетевое математическое моделирование в задачах ранжирования и кластеризации в бюджетно-налоговой системе регионального и муниципального уровней: Монография / С.А. Горбатков и др. – Уфа: РИЦ БашГУ, 2011. – 224 с.

2. Горбатков С.А., Полупанов Д.В. Методы нейроматематики в налоговом контроле. / Под ред. д.т.н., проф. С.А. Горбаткова. – Уфа: РИЦ БашГУ, 2008. – 136 с.

3. Алгоритм структурирования данных с использованием вспомогательных нейросетевых субмоделей и построение рабочей нейросетевой модели с байесовской регуляризацией. / Горбатков С.А.

Фархиева С.А. // Свидетельство о регистрации электронного ресурса в ОФЭРНиО ИНИМ РАО № 16403 от 22.11.2010г. Номер государственной регистрации в Национальном информационном фонде неопубликованных документов: 50201050147.

4. Оценка эффективности алгоритмов предрегуляризации и байесовской регуляризации нейросетей для камеральной налоговой проверки. / Горбатков С.А., Белолипцев И.И., Фархиева С.А., Полупанов Д.В. // Научная сессия НИЯУ МИФИ-2012. XIV всероссийская научно-техническая конференция «Нейроинформатика-2012»: М.: НИЯУ МИФИ. 2012. С. 38-48.

5. Шумский С.А. Байесова регуляризация обучения // Научная сессия МИФИ 2002. IV Научно-техническая конференция «Нейроинформатика – 2002»: Лекции по нейроинформатике. Часть 2. – М.: МИФИ, 2002, с. 30-93.

6. Модернизация налогового контроля (модели и методы): Монография / Под ред. А.Н.Романова. – М.: ИНФРА-М: Вузовский учебник, 2010. – XI. 320 с.





Похожие работы:

«К ВОПРОСУ ОБ ИСПОЛЬЗОВАНИИ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ В ВУЗОВСКОЙ СИСТЕМЕ ОЦЕНКИ КАЧЕСТВА Шестакова Мария Викторовна магистрант 1 курса Института математики, информационных и космических технологий Северный (Арктический) федеральный университет имени М.В. Ломоносова, РФ, г. Архангельск E-mail: shes-mariya@yandex.ru Чиркова Лидия Николаевна кан. пед. наук, доцент кафедры экспериментальной математики и информатизации образования Северный (Арктический) федеральный университет имени М.В. Ломоносова,...»

«Н.В. Пащевская профессор кафедры математики и информатики, к.х.н., Кубанский социально-экономический институт N.V. Pashevskaya Professor Department of Mathematics and Computer Science, Ph.D., Kuban Social and Economic Institute В. Е. Ахрименко профессор кафедры неорганической и аналитической химии, д.х.н., Кубанский государственный аграрный университет V.E. Ahrimenko Professor of the Department of Inorganic and Analytical Chemistry, Ph.D., Kuban State Agrarian University ДИФФЕРЕНЦИАЦИЯ В...»

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ЭКОНОМИКИ, СТАТИСТИКИ И ИНФОРМАТИКИ (МЭСИ) Аль-Хассан М.А. Максимова В.Ф. ТРАНСФОРМАЦИЯ РЫНКА ТРУДА В СТРАНАХ ПЕРСИДСКОГО ЗАЛИВА Монография Москва, 2013 УДК 331.5 ББК 65.050 А 56 Аль-Хассан М.А., Максимова В.Ф. ТРАСФОРМАЦИЯ РЫНКА ТРУДА В СТРАНАХ ПЕРСИДСКОГО ЗАЛИВА. Монография. – М.: МЭСИ, 2013. – 122 с. Монография затрагивает важную проблему трансформации рынка труда в условиях формирования наукоёмкой...»

«Том 7, №4 (июль август 2015) Интернет-журнал «НАУКОВЕДЕНИЕ» publishing@naukovedenie.ru http://naukovedenie.ru Интернет-журнал «Науковедение» ISSN 2223-5167 http://naukovedenie.ru/ Том 7, №4 (2015) http://naukovedenie.ru/index.php?p=vol7-4 URL статьи: http://naukovedenie.ru/PDF/72EVN415.pdf DOI: 10.15862/72EVN415 (http://dx.doi.org/10.15862/72EVN415) УДК 657 Чжан Шуан ФГБОУ ВПО «Московский университет экономики, статистики и информатики (МЭСИ)» Россия, Москва1 Аспирантка E-mail:...»

«Организация и использование информационных ресурсов БЫСТРОВ Виталий Викторович младший научный сотрудник Института информатики и математического моделирования технологических процессов Кольского научного центра РАН, аспирант Петрозаводского государственного университета (г.Апатиты) ГОРОХОВ Андрей Витальевич – доктор технических наук, главный научный сотрудник Института информатики и математического моделирования технологических процессов Кольского научного центра РАН, заведующий кафедрой...»





 
2016 www.os.x-pdf.ru - «Бесплатная электронная библиотека - Научные публикации»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.