Статья 'Аналитическое вероятностное моделирование bitmap-индексов' - журнал 'Программные системы и вычислительные методы' - NotaBene.ru
по
Меню журнала
> Архив номеров > Рубрики > О журнале > Авторы > О журнале > Требования к статьям > Редсовет > Редакция > Порядок рецензирования статей > Политика издания > Ретракция статей > Этические принципы > Политика открытого доступа > Оплата за публикации в открытом доступе > Online First Pre-Publication > Политика авторских прав и лицензий > Политика цифрового хранения публикации > Политика идентификации статей > Политика проверки на плагиат
Журналы индексируются
Реквизиты журнала

ГЛАВНАЯ > Вернуться к содержанию
Программные системы и вычислительные методы
Правильная ссылка на статью:

Аналитическое вероятностное моделирование bitmap-индексов

Труб Илья Иосифович

кандидат технических наук

ведущий инженер-программист, ООО "Исследовательский центр Samsung"

127018, Россия, г. Москва, ул. Двинцев, 12, оф. C

Trub Ilya

PhD in Technical Science

Senior Software Engineer, Samsung Research Center Ltd.

127018, Russia, Moscow, ul. Dvintsev, 12, of. C

itrub@yandex.ru
Другие публикации этого автора
 

 

DOI:

10.7256/2454-0714.2016.4.21091

Дата направления статьи в редакцию:

16-11-2016


Дата публикации:

15-01-2017


Аннотация: Объектом исследования являются двоичные (bitmap)-индексы как средство повышения эффективности обработки поисковых запросов и построения отчетов в современных СУБД. Предметом исследования является математическая модель зависимости количества индексов, необходимых для построения выборки, удовлетворяющей запросу, от интенсивности добавления записей в базу данных и заданного диапазона значений запроса. Данная характеристика является наиболее значимой для оценки производительности обработки запроса, так как определяет количество операций дизъюнкции над битовыми строками, которое необходимо выполнить для получения результирующей выборки. Данная задача возникла целиком из практических потребностей ввиду критического влияния быстродействия построения отчетов на потребительскую ценность коммерческих продуктов - приложений СУБД. Методологией исследования является вероятностное аналитическое моделирование на основе представления исходных данных в виде пуассоновских процессов, а также использование аппарата математического анализа (интегральное исчисление и суммирование рядов) для получения конечных результатов. Новизна исследования заключается в разработке математической модели, предложенной для данного объекта исследования, которая позволяет ставить широкий спектр задач анализа и оптимизации. Поставленная задача решена - получены формулы для распределения количества индексов и среднего количества индексов в одном запросе. Для каждого результата проведена оценка его достоверности на основе альтернативного подхода или правдоподобных рассуждений. Поставлены задачи построения вероятностной модели для распределений произвольного вида и оптимизации обработки запросов с помощью иерархических bitmap-индексов. Следует отметить, что сформулированная в работе задача и полученные результаты имеют и самостоятельное теоретическое значение в рамках теории массового обслуживания безотносительно к прикладной области.


Ключевые слова:

двоичные индексы, дизъюнкция, база данных, поисковый запрос, Пуассоновский поток, теория массового обслуживания, уравнения баланса, интегрирование и суммирование, комбинаторика, анализ и оптимизация

Abstract: The study is devoted to bitmap-indexes as a tool of improving efficiency of processing search queries and reporting in the current database. The subject of research is mathematical model of dependence of the number of indexes, required to build a sample that meets the request, on the intensity of adding records to the database and query the specified range of values. This characteristic is most significant for evaluating query processing performance because it determines the number of disjunction operations on bit strings, required to get a result set. This problem arose entirely from the practical needs due to the critical impact of the speed of building of reports on customer value commercial products - database applications. The methodology of this study is probabilistic analytical modeling based on representations of the original data in the form of Poisson process and the use of the apparatus of mathematical analysis (integral calculus and summation rows) to get the final results. The novelty of the research is to develop a suggested mathematical model, which allows to put a wide range of problems of the analysis and optimization. The problem is solved – the author presents the formula for the distribution of the number of indexes, and the average number of indexes in a single query. For each result author evaluated reliability on the basis of an alternative approach or plausible reasoning. The paper sets the tasks of constructing a probabilistic model for the distribution of any type of query processing and optimization using hierarchical bitmap-indexes. It should be noted, that formulated problem and the results obtained have an independent theoretical value within the queuing theory without regard to the application area.


Keywords:

bitmap-indexes, disjunction, database, fetch request, poisson distribution, queueing theory, balance equations, integration and summation, combinatorics, analysis and optimization

Библиография
1. Артамонов Г.Т., Брехов О.М. Аналитические вероятностные модели функционирования ЭВМ. М.: Энергия, 1978. 368 с.
2. Градштейн И.С., Рыжик И.М. Таблицы интегралов, сумм, рядов и произведений. 4-е изд. М.: Государственное издательство физико-математической литературы, 1963. 1100 с.
3. Кирстен В., Ирингер М., Кюн М., Рериг Б. СУБД Cache 5: объектно-ориентированная разработка приложений. 2-е изд. М.: Бином, 2005. 416 с.
4. Клейнрок Л. Теория массового обслуживания. М.: Машиностроение, 1979. 432 с.
5. Клейнрок Л. Вычислительные системы с очередями. М.: Мир, 1979. 595 с.
6. СУБД Oracle. Администрирование, разработка и программирование. Индексы. URL: http://oracledb.ru/sql/ddl-i-obekty-sxemy/indeksy.html (дата обращения 16.11.2016)
7. Труб И.И. Об оптимальной стратегии генерирования результатов запросов к Internet-серверу баз данных // Автоматика и телемеханика. 2003. № 6. С. 95-103.
8. Труб И.И. СУБД Cache: работа с объектами. М.: Диалог-МИФИ, 2006. 480 с.
9. Шарма В. Bitmap-индекс или B*tree-индекс: какой и когда применять? URL: http://citforum.ru/database/oracle/bb_indexes/ (дата обращения 16.11.2016)
10. Bitmap-индексы в Cache на глобалах. URL: https://habrahabr.ru/company/intersystems/blog/174657/ (дата обращения 16.11.2016)
References
1. Artamonov G.T., Brekhov O.M. Analiticheskie veroyatnostnye modeli funktsionirovaniya EVM. M.: Energiya, 1978. 368 s.
2. Gradshtein I.S., Ryzhik I.M. Tablitsy integralov, summ, ryadov i proizvedenii. 4-e izd. M.: Gosudarstvennoe izdatel'stvo fiziko-matematicheskoi literatury, 1963. 1100 s.
3. Kirsten V., Iringer M., Kyun M., Rerig B. SUBD Cache 5: ob''ektno-orientirovannaya razrabotka prilozhenii. 2-e izd. M.: Binom, 2005. 416 s.
4. Kleinrok L. Teoriya massovogo obsluzhivaniya. M.: Mashinostroenie, 1979. 432 s.
5. Kleinrok L. Vychislitel'nye sistemy s ocheredyami. M.: Mir, 1979. 595 s.
6. SUBD Oracle. Administrirovanie, razrabotka i programmirovanie. Indeksy. URL: http://oracledb.ru/sql/ddl-i-obekty-sxemy/indeksy.html (data obrashcheniya 16.11.2016)
7. Trub I.I. Ob optimal'noi strategii generirovaniya rezul'tatov zaprosov k Internet-serveru baz dannykh // Avtomatika i telemekhanika. 2003. № 6. S. 95-103.
8. Trub I.I. SUBD Cache: rabota s ob''ektami. M.: Dialog-MIFI, 2006. 480 s.
9. Sharma V. Bitmap-indeks ili B*tree-indeks: kakoi i kogda primenyat'? URL: http://citforum.ru/database/oracle/bb_indexes/ (data obrashcheniya 16.11.2016)
10. Bitmap-indeksy v Cache na globalakh. URL: https://habrahabr.ru/company/intersystems/blog/174657/ (data obrashcheniya 16.11.2016)
Ссылка на эту статью

Просто выделите и скопируйте ссылку на эту статью в буфер обмена. Вы можете также попробовать найти похожие статьи


Другие сайты издательства:
Официальный сайт издательства NotaBene / Aurora Group s.r.o.