Статья 'Исследование потенциала социальных сетей для выявления одаренных старшеклассников' - журнал 'Психология и Психотехника' - NotaBene.ru
по
Меню журнала
> Архив номеров > Рубрики > О журнале > Авторы > Требования к статьям > Политика издания > Редакция > Порядок рецензирования статей > Редакционный совет > Ретракция статей > Этические принципы > О журнале > Политика открытого доступа > Оплата за публикации в открытом доступе > Online First Pre-Publication > Политика авторских прав и лицензий > Политика цифрового хранения публикации > Политика идентификации статей > Политика проверки на плагиат
Журналы индексируются
Реквизиты журнала
ГЛАВНАЯ > Вернуться к содержанию
Психология и Психотехника
Правильная ссылка на статью:

Исследование потенциала социальных сетей для выявления одаренных старшеклассников

Мацута Валерия Владимировна

кандидат психологических наук

доцент, Национальный исследовательский Томский государственный университет

634028, Россия, Томская область, г. Томск, ул. Учебная, 18

Matsuta Valeriya Vladimirovna

PhD in Psychology

associate professor at Tomsk State University

634028, Russia, Tomsk Region, Tomsk, str. Uchebnaya, 18, room No. 9

matsuta-vv@mail.ru
Киселев Павел Борисович

соискатель, Психологический институт, Российская академия образования

125009, Россия, г. Москва, ул. Моховая, 9, стр. 4

Kiselev Pavel Borisovich

post-graduate student at Psychology Institute under the Russian Academy of Education

125009, Russia, Moscow Region, Moscow, str. Mokhovaya, 9 bld.4

forestfield@yandex.ru
Фещенко Артем Викторович

старший преподаватель, Национальный исследовательский Томский государственный университет

634050, Россия, Томская область, г. Томск, ул. Ленина, 36

Feshchenko Artem Viktorovich

senior lecturer at Tomsk State University

634050, Russia, Tomsk Region, Tomsk, Lenin's str., 36

fav@ido.tsu.ru
Гойко Вячеслав Леонидович

аспирант, Национальный исследовательский Томский государственный университет

634050, Россия, Томская область, г. Томск, ул. Ленина, 36

Goiko Vyacheslav Leonidovich

post-graduate student at Tomsk State University

634050, Russia, Tomsk Region, Tomsk, Lenin's str., 36

goiko.slava@gmail.com

DOI:

10.7256/2454-0722.2017.4.24931

Дата направления статьи в редакцию:

07-12-2017


Дата публикации:

16-01-2018


Аннотация: Работа посвящена оценке возможностей социальной сети «ВКонтакте» для выявления важных для определения одаренности психологических качеств и интересов старшеклассников. Актуальность связана с запросом региона, нацеленного на обеспечение высокого уровня подготовки будущих студентов и достижение значительных показателей поступления абитуриентов в свои вузы, и заинтересованного в поиске и привлечении одаренных учащихся старших классов – своих потенциальных абитуриентов. Одаренность в работе определена как сочетание интеллекта, креативности, мотивационно-личностных особенностей. Методы: психологическое тестирование (методика «#Профориентация»), анализ академической успеваемости, анализ структуры и содержания профилей в социальной сети, контент-анализ, процентильная нормализация, машинное обучение (бинарная классификация, метод опорных векторов). Выборка: 1692 человека – 969 девушек и 723 юноши – старшеклассники г. Томска. Новизна заключается в изучении данных пользователей социальной сети именно для определения одаренности. Применение машинного обучения, позволяющего учитывать большое количество испытуемых и признаков, дает возможность с удовлетворительной точностью идентифицировать испытуемых с высоким уровнем развития психологических качеств (компонентов одаренности) и устанавливать связи между этим уровнем и принадлежностью к сообществам социальной сети. Прогнозирование осуществляется на основе региональных и федеральных сообществ-маркеров. Часть сообществ-маркеров ориентирована на пол испытуемых. Одаренные старшеклассники достаточно открыты и доступны для общения в социальной сети. Девушки ориентированы на сообщества с познавательным, социальным и коммерческим контентом, юноши – с развлекательным и познавательным. Девушки публикуют посты и репосты с целью информирования, развлечения, побуждения к действиям. Юноши – с целью информирования и развлечения.


Ключевые слова:

одаренность, психологические качества, социальные сети, психологическое тестирование, анализ профиля, анализ больших данных, машинное обучение, бинарная классификация, метод опорных векторов, старшеклассники

Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 17-16-70004.

Abstract:  The article is devoted to evaluating opportunities of the social network Vkontakte to define senior school students' psychological traits and interests that are important for defining giftedness. The rationale of the research is caused by the request of the region's government to provide a high level of education of future students and achievement of good success of senior school students in admission to universities. The region's government is also interested in seeking and attracting gifted senior high school students as their potentials enrollees. Giftedness is defined as the combination of intellect, creativity, motivation and personality traits. The research methods include psychological tests (Career Guidance Inventory), analysis of academic success, structure and contents of network profiles, content analysis, percentile normalisation, computer-aided learning (binary classification, and Support Vector Machine). The research involved 1692 people, 969 young women and 723 young men who studied at a high school in Tomsk. The  novelty of the research is caused by the fact that the authors analyse social network users to define their giftedness. Computer-aided learning that allows to cover a bigger number of respondents and features gives an opportunity to identify respondents with a high level of development of particular psychological features (giftedness components) and define connections between this level and attribution to social network communities. Gifted seniors are rather open and contactable on social media platforms. Young women are oriented at learning, social and commercial communities, young men are interested in advertising and learning communities. Young women make posts and reposts to inform, advertise and motivate. Young men do that to inform and advertise. 


Keywords:

giftedness, psychological characteristics, social networks, psychological testing, profile analysis, big data analysis, machine learning, binary classification, support vector machine, senior high school students

Введение

В социальных сетях генерируются значительные потоки информации, которые характеризуются высоким уровнем динамичности и масштабности. Пропускная способность социальных сетей стабильно возрастает, и вместе с этим растет скорость передачи данных, а значит, и их обработки.

На основе использования современных технологий анализа больших данных получаемая из социальных сетей информация, которая на первый взгляд представляется разрозненной, может быть распределена по огромному количеству критериев – как общих для отдельных групп пользователей, так и персонально-ориентированных.

Эти критерии формулируются в соответствии с социальными и экономическими задачами, решаемыми как на национальном, так и на региональном уровне. Так, регионы, стремясь повысить качество системы высшего образования и расширить рынок предлагаемых образовательных услуг, нацелены на обеспечение высокого уровня подготовки будущих студентов и достижение значительных показателей поступления абитуриентов в региональные вузы, заинтересованы в поиске и привлечении одаренных учащихся старших классов – своих потенциальных абитуриентов.

Цель данного исследования – оценить, как социальные сети могут быть использованы для выявления важных для определения одаренности психологических качеств и интересов учащихся старших классов. Оценка производилась на основе анализа данных психологического тестирования и данных, представленных в профилях пользователей в социальной сети «ВКонтакте» («цифровых следов» пользователей).

Методологическими основаниями исследования послужили современные научные представления об одаренности, изложенные в работах отечественных и зарубежных ученых: концепции одаренности Ю. Д. Бабаевой, Д. Б. Богоявленской [9], Н. С. Лейтеса [8], А. М. Матюшкина [7], А. А. Мелик-Пашаева [15], Д. В. Ушакова [12], М. А. Холодной [14], В. Д. Шадрикова [9], Н. Б. Шумаковой [17], Е. И. Щеблановой [18], В. С. Юркевич [20] и др., многомерные модели одаренности Дж. Рензулли [10, 38], К. Хеллера [13, 29] и др.

В соответствии с указанными представлениями одаренность принято рассматривать как взаимодействие интеллекта, креативности и мотивационно-личностных особенностей. Одаренными считаются люди, обладающие высоким уровнем развития этих качеств или способные их развить и использовать в любой потенциально ценной деятельности [18].

Общую выборку исследования составили 1692 человека – 969 девушек и 723 юноши – учащиеся старших классов средних общеобразовательных учебных заведений г. Томска.

Методы исследования. Методы сбора данных: психологическое тестирование, анализ академической успеваемости, «ручной» анализ структуры и содержания профилей в социальной сети.

Методы обработки и анализа данных: процентильная (нелинейная) нормализация, машинное обучение (бинарная классификация на основе моделей: метод опорных векторов, случайные леса и градиентный бустинг), контент-анализ.

На первом этапе исследования был произведен сбор данных с помощью метода психологического тестирования испытуемых, который является классическим для диагностики одаренности. Была применена компьютеризированная методика «#Профориентация», предназначенная для учащихся старших классов образовательных учреждений разного вида [1].

Кроме основной цели – определения общей направленности профессиональной ориентации – с помощью данной методики могут решаться задачи определения интеллектуального потенциала испытуемых, изучения их личностных свойств и качеств (эмоциональных, волевых, коммуникативных), профессиональных интересов и ценностей, а также карьерных ориентаций.

Для изучения интеллектуального компонента одаренности были использованы субтесты «Аналогии» и «Когнитивные стили». Для изучения креативного компонента одаренности были использованы субтесты «Самооценка креативности» и «Опросник креативного поведения». Для изучения мотивационно-личностного компонента одаренности были использованы субтесты «Волевые качества личности», «Социальный интеллект», «Мотивы выбора профессии».

Для изучения академической успеваемости испытуемых были проанализированы их оценки за последнее полугодие по учебным предметам, соответствующим гуманитарному (русский язык, литература, история, обществознание, иностранный язык), физико-математическому (алгебра, геометрия, физика, информатика) и естественнонаучному (биология, химия, география) направлениям обучения.

Результаты исследования и их обсуждение

На втором этапе исследования собранные данные подверглись процедуре процентильной (нелинейной) нормализации, благодаря которой были выделены группы испытуемых в зависимости от обнаруженных уровней развития интеллекта, креативности и мотивационно-личностных качеств.

На третьем этапе исследования были проведены анализ данных и интерпретация для группы испытуемых, значения показателей которых вошли в верхний квартиль (от 75 до 100%).

Когнитивный компонент одаренности

В рамках когнитивного подхода, который является доминирующим и наиболее разработанным в изучении одаренности [18], под одаренностью понимается высокий уровень когнитивных способностей и / или интеллекта в целом.

Анализ данных показывает, что для 17,9% девушек и 25% юношей характерна способность устанавливать логико-функциональные связи между понятиями на основе различных видов отношений.

Для 25% девушек и 15% юношей характерен конвергентный когнитивный стиль – мышление, сознательно контролируемое и ориентированное на поиск единственно правильного решения.

Дивергентный когнитивный стиль характерен для 24,6% девушек и 23,4% юношей. Дж. Гилфорд связывает креативность именно со способностями к дивергентному мышлению, направленному на создание множества разнообразных новых, нетривиальных решений «открытых», т. е. не имеющих единственного решения проблем. Испытуемые с дивергентным когнитивным стилем обычно отличаются широтой интересов.

24,4% девушек и 23,7% юношей имеют высокие оценки по предметам, соответствующим естественнонаучному направлению, 25,4% девушек и 19,2% юношей – физико-математическому, 17,4% девушек и 18% юношей – гуманитарному. Полученные данные позволяют говорить о высоком уровне академической одаренности испытуемых, определяемой успешностью обучения.

Креативный компонент одаренности

В соответствии с концепцией Э. П. Торренса, основными параметрами креативности являются беглость, гибкость, оригинальность и разработанность [41-42]. Беглость отражает способность к генерированию большого числа идей за единицу времени. Наличие этой способности отмечают у себя 18,3% девушек и 18,8% юношей.

Гибкость связана со способностью к выдвижению разных идей, переходу от одного аспекта проблемы к другому, использованию разных стратегий ее решения. Гибкость характерна для 13,9% девушек и 10,2% юношей.

Оригинальность – ключевая характеристика креативности, способность к выдвижению необычных, неординарных идей, отличающихся от очевидных, общепринятых или твердо установленных. Оригинальность характерна для 23,7% девушек и 9,4% юношей.

23,8% девушек и 18,8% юношей отличаются креативностью, высокой внутренней мотивацией к творческой активности и продуктивности.

Можно заключить, что, в целом, испытуемые-девушки оценивают себя как более креативных, чем испытуемые-юноши.

Мотивационно-личностный компонент одаренности

В рамках личностного подхода к изучению одаренности главное внимание уделяется мотивационным, эмоциональным и другим личностным характеристикам одаренных людей, рассматриваемым в качестве основных определяющих факторов и условий развития и самореализации.

Познавательная мотивация рассматривается как общая характеристика и структурный компонент личности одаренного человека [2-3, 6, 10-11, 16, 20, 22-23, 25-28, 39-40, 43]. Она характерна для 6% девушек и 5,8% юношей. Они отличаются стремлением к познанию, постижению сущности деятельности и получению интеллектуального удовлетворения от деятельности.

Мотив самореализации выражен у 87% девушек и 82% юношей. Они стремятся к реализации в деятельности, которая рассматривается ими как возможность развития своих способностей. Полная самореализация человека, с точки зрения К. Г. Юнга, является конечной целью его жизни, однако этой цели достигают только самые способные, высокообразованные и имеющие достаточный досуг люди [19]. А. Маслоу считает, что только одаренные люди, составляющие менее 1% населения, достигают реализации своего потенциала [6].

Испытуемые отличаются выраженными качествами, характерными для одаренных людей и обеспечивающими эффективную реализацию деятельности [2-3, 6, 10-11, 16, 20, 22-23, 25-28, 32, 39-40, 43].

Так, инициативность как активная направленность личности на совершение действия характерна для 24,6% девушек и 22,8% юношей. Настойчивостью отличаются 24,1% девушек и 23,2% юношей – они умеют мобилизовать свои силы для устойчивого и длительного преодоления препятствий, возникающих на пути достижения цели. Решительность характерна для 19,9% девушек и 21,9% юношей. Они умеют принимать и реализовывать быстрые, обоснованные и твердые решения.

22,8% девушек и 18,9% юношей способны вступать в новые социальные ситуации, устанавливать контакты с новыми людьми и успешно социально адаптироваться.

Можно заключить, что одаренные старшеклассники обладают мотивационно-личностными качествами, которые принято считать прогностически благоприятными для значительных достижений в деятельности.

Анализ данных профилей пользователей в социальной сети «ВКонтакте»

На четвертом этапе исследования одаренные старшеклассники были идентифицированы в социальной сети «ВКонтакте». Были проанализированы следующие группы данных:

1. Профиль: фамилия, имя и псевдоним, контакты, образование и карьера, жизненная позиция, количество друзей.

2. Авторские записи (посты) и репосты.

3. Подписки на группы и интересные страницы.

Целостный анализ профиля позволяет говорить о том, что большинство одаренных девушек и юношей достаточно открыты, однако нельзя утверждать, что они неосторожны или излишне доверчивы, поскольку в их профилях отсутствует слишком большое количество личной и, тем более, интимной информации (как графической, так и текстовой).

Имя, фамилия и псевдоним пользователя

Поскольку указание реальных имени и фамилии является одним из обязательных требований при регистрации в «ВКонтакте», у 100% испытуемых – девушек и юношей указаны реальные имя и фамилия. Однако следует отметить, что здесь речь идет о 73% идентифицированных в социальной сети пользователях с открытыми и закрытыми профилями (67%, n=1692 и 6%, n=162, соответственно). 27% (n=688) испытуемых не удалось идентифицировать в социальной сети, поскольку либо они в ней не зарегистрированы, либо используют псевдонимы.

Полное написание имени встречается у 84% девушек и 76,1% юношей. Уменьшительное написание имени встречается гораздо реже (16% девушек и 19,6% юношей), уменьшительно-ласкательное написание имени отсутствует полностью. Уменьшительно-ласкательное написание имени некоторые психологи считают проявлением инфантилизма. Основываясь на полученных данных, можно сказать, что для большинства испытуемых он не характерен.

4,3% юношей используют полное написание фамилии, имени и отчества, что может указывать на их на стремление подчеркнуть свою значимость.

Контактная информация пользователя

Представленность контактов может говорить об открытости или закрытости, доступности или недоступности пользователя для общения.

У 100% девушек и юношей указан город проживания. У 8% девушек и 8,7% юношей указан номер мобильного телефона, у 8,7% юношей этот номер указан, но скрыт для пользователей, не входящих в круг их друзей.

У 40% девушек и 13% юношей указана интеграция с сервисом Instagram, у 8% девушек и 4,3% юношей – с социальной сетью Twitter, 4% девушек и 2,2% юношей – с социальной сетью Facebook. У 8% девушек и 4,3% юношей указана ссылка на их сайт, у 4% девушек и 15,2% – логин в Skype.

Можно заключить, что, в целом, одаренные старшеклассники достаточно открыты и доступны для общения в социальной сети.

Образование и карьера

Данных об опыте обучения и работы у испытуемых не представлено. У 100% девушек и 65,2% юношей имеются сведения об образовательном учреждении, в котором они обучаются.

Жизненная позиция

Жизненная позиция обозначена у 16% девушек и 32,6% юношей. 8% девушек и 26,7% юношей разделяют православное мировоззрение, 8% девушек и 13,3% юношей – атеистическое.

12% девушек разделяют умеренные политические предпочтения, 6,7% юношей – либеральные, 6,7% юношей – социалистические и 6,7% юношей – коммунистические.

Главными жизненными ценностями 4% девушек считают совершенствование мира, 4% девушек и 33,3% юношей – семью и детей, 8% девушек и 20% юношей – развлечения и отдых, 13,3% юношей – саморазвитие, 6,7% юношей – красоту и искусство. Главные ценности в людях, по мнению 12% девушек и 33,3% юношей, это – доброта и честность, 4% девушек и 20% юношей – смелость и упорство, 20% юношей – юмор и жизнелюбие.

Негативно относятся к курению 66,7% юношей, к алкоголю – 33,3%. Нейтральным отношением к курению обладают 13,3% юношей, к алкоголю – 26,7%. Компромиссным отношением к алкоголю отличаются 20% юношей. В профилях у девушек данная информация не представлена.

Источниками вдохновения 36% девушек и 26,7% юношей считают музыку, 16% девушек – общение, 4% девушек и 13,3 юношей – путешествия, 4% девушек – кино, по 6,7% юношей – спорт, архитектуру и сериалы.

Друзья

Минимальное количество друзей у испытуемых-девушек – 1 человек, максимальное – 489, у испытуемых-юношей – 5 человек, максимальное – 1349. В исследовании американских ученых показано, что в среднем у каждого пользователя социальной сети 150 друзей, что подтверждает известное в антропологии число Данбара (ограничение количества постоянных социальных связей, которые человек может поддерживать, ста пятьюдесятью связями) [24]. В исследовании испанских ученых говорится, что максимальное количество друзей в социальной сети не должно превышать 354. Если их больше, это может сделать человека несчастливым и даже привести к депрессии [5].

Если взять за нормативное значение вышеуказанное количество друзей, то можно сказать, что 96% девушек и 87% юношей имеют количество друзей, потенциально не опасное для развития депрессии и других негативных состояний. 40% девушек и 52,2% юношей имеют количество друзей в пределах указанного нормативного значения до 150 человек, 56% девушек и 34,8% юношей попадают в диапазон количества друзей от 150 до 354 человек.

На основании полученных данных можно предполагать, что даже для экстровертированных испытуемых не характерна поверхностность и неразборчивость общения, поскольку значительного превышения указанных нормативных значений не обнаружено.

Группы и интересные страницы

Группы – тематические сообщества друзей, коллег по работе и учебе. В социальной сети «ВКонтакте» создано более 16 миллионов групп, среди которых пользователи могут искать интересующие или создавать свои.

Среди групп у испытуемых-девушек лидируют сообщества с познавательным, социальным и коммерческим контентом (см. табл. 1).

Таблица 1.

Рейтинг сообществ по виду контента

Выборка девушек

Выборка юношей

1

Познавательный контент

Развлекательный контент

2

Социальный контент

Познавательный контент

3

Коммерческие контент

-

4

Развлекательный контент

-

В категорию сообществ с познавательным контентом входят группы, в которых размещается такая информация, как обучающие статьи, инструкции, результаты исследований, записи мастер-классов, вебинаров, полезная инфографика, интервью с экспертами и т. д.

В категорию сообществ с социальным контентом входят группы, в которых размещается информация о социальных (благотворительных, волонтерских) проектах и мероприятиях.

В категорию сообществ с коммерческим контентом входят группы, в которых размещаются каталоги с фото, описанием и ценами товаров, акции и конкурсы. У девушек, в основном, это сообщества, предлагающие приобрести одежду, обувь, косметику, товары для творчества, книги и канцелярию.

В категорию сообществ с развлекательным контентом входят группы, в которых размещается такая информация, как юмор, подборки красивых фото, открытки, интересные истории, анекдоты, мемы, мотиваторы и демотиваторы, открытки, загадки, цитаты, стихи, музыка, художественные фильмы и т. д.

В блоке «Интересные страницы» отображаются сообщества, в которых пользователи проявляют наибольшую активность: куда чаще заходят, какие фотографии, видеозаписи открывают, какие записи комментируют и пр. Количество таких страниц у девушек варьирует от 2 до 281, у юношей – от 3 до 325.

Сообщества с познавательным контентом являются лидирующими у всех испытуемых (см. табл. 2). 100% девушек и юношей интересны сообщества, позволяющие:

- повысить эрудицию и расширить кругозор за счет получения новых знаний, в т. ч. по определенным учебным предметам;

- подготовиться к сдаче ЕГЭ;

- научиться определенному виду деятельности, получить полезные навыки и т. п.

Таблица 2.

Рейтинг интересных страниц по виду контента

Выборка девушек

Выборка юношей

1

Познавательные

Познавательные

2

Социальные

Развлекательные и полезные («мужские»)

3

Полезные и развлекательные («женские»)

Спортивные

4

Спортивные

Городские

5

Городские

Новостные

6

Новостные

Коммерческие

7

Коммерческие

На втором месте у девушек находятся сообщества, задачами которых являются разработка и предложение социальных проектов (благотворительных, волонтерских), организация и проведение социальных мероприятий на постоянной и периодической основе.

У юношей вторыми идут сообщества с развлекательным контентом – кино, сериалы, музыка, юмор и комиксы. Интересно, что здесь у юношей лидируют сообщества категории 18+, содержание которых отражает «традиционные» для мужчин темы: авто и мото, оружие, охота, рыбалка, спорт, тотализаторы, компьютерные игры, бои и драки, девушки, черный, грубый и пошлый юмор.

На третьем месте у девушек находятся так называемые «женские» сообщества, содержание которых отражает «традиционные» для женщин темы: беременность и материнство, отношения, забота о близких, здоровье, красота, мода, домоводство, творчество и рукоделие, работа.

У юношей третьими идут спортивные сообщества (обычно ограничены конкретным видом спорта или спортивным фан-клубом). У девушек они занимают четвертое место и являются фитнес-сообществами или сообществами определенных фитнес-клубов.

На пятом месте у девушек и четвертом у юношей находятся так называемые «городские» сообщества – сообщества людей, связанных общим местоположением, организацией или событием. Контент городских сообществ – городские новости, афиша, учебные заведения, черные и белые списки организаций, вакансии и возможности подработки.

Шестыми у девушек и пятыми у юношей идут новостные сообщества. Наконец, завершают список у всех испытуемых сообщества с коммерческим контентом.

Следует отметить, что такое разделение сообществ достаточно условно – многие из них являются смешанными. Так, например, сообщества учебных заведений одновременно являются и сообществами места и сообществами интересов.

Авторские посты и репосты

Авторские посты и репосты – универсальные инструменты распространения информации в социальной сети. Они могут содержать текст, изображение, аудио- или видеозапись, и отображаются в ленте новостей друзей и подписчиков пользователя.

Для 60% испытуемых-девушек характерна публикация постов, целями размещения которых являются информирование и развлечение (35%) и побуждение к действиям (40%). Для испытуемых-юношей характерна публикация постов, целью размещения которых является информирование и развлечение (40%). В основном, посты содержат фотографии, смешные картинки, иногда сопровождаемые авторскими комментариями.

Для испытуемых характерно меньшее количество репостов, чем постов. Целями размещения репостов, в основном, являются сохранение интересной и полезной информации (62% у девушек, 31% - у юношей), информирование и развлечение (52% у девушек, 36% – у юношей), а также побуждение к действиям (только у девушек – 48%). Репосты девушек обычно призывают помочь социально незащищенным категориям населения и бездомным животным.

На основании результатов «ручного» анализа структуры и содержания профилей испытуемых в социальной сети можно говорить о некоторых психологических качествах, свойственных одаренным старшеклассникам. Данный анализ был реализован и с целью разработки модели, благодаря которой будет возможен анализ профилей старшеклассников, не прошедших предварительного психологического тестирования для определения одаренности.

Однако у подобного анализа имеются ограничения, затрудняющие определение признаков одаренности в «цифровом следе» пользователей:

- специфика контекста развлекательной направленности, доминирующего в «ВКонтакте» при фактическом отсутствии «полезных» видов деятельности;

- специфика графического контента, доминирующего в «ВКонтакте» – методы психолингвистики в этом случае не применимы, поскольку вместо авторского текста размещаются изображения;

- слишком большое количество признаков для проведения «ручного» анализа – у одного пользователя может быть только 200 подписок на группы и интересные страницы, и если анализировать еще и его тексты, связи, реакции и пр., таких признаков у одного пользователя может «накопиться» до нескольких сотен.

Поэтому для определения одаренных старшеклассников на пятом этапе исследования был применен метод, позволяющий проводить масштабные исследования как по количеству испытуемых, так и по количеству необходимых для анализа признаков, – метод машинного обучения.

Анализ данных профилей пользователей социальной сети «ВКонтакте» методами машинного обучения

В исследовании W. Pennebaker [36] было показано, что именно методы машинного обучения помогают понять связь между данными о человеке и психологическими качествами. Это исследование было посвящено использованию метода опорных векторов для прогнозирования по авторским текстам личностных качеств опросника «Большая пятерка». Лучшим результатом стала точность 58% для шкалы «Нейротизм».

В другом исследовании S. Nowson, J. Oberlander, A. J. Gill [35] о связи текстов блогеров и личностных качеств опросника «Большая пятерка», показана значимая корреляция между характеристиками текста и результатами по шкалам «Открытость» и «Доброжелательность».

Широкую известность получили работы M. Kosinski и D. Stillwell при участии специалиста по машинному обучению T. Graepel. В рамках реализованного ими проекта Mypersonality были собраны данные социальных сетей и результаты заполнения различных психодиагностических опросников более чем семи миллионов пользователей [33].

Исследователи благодаря использованию моделей машинного обучения показали, что у каждого пишущего пользователя социальных сетей (а не только у профессиональных писателей) есть своеобразный «языковой отпечаток», получивший название «stylome» [34]. Предполагается, что люди со схожими психологическими качествами имеют схожие «языковые отпечатки» [4]. Также предполагается, что все действия пользователя в информационных системах, будь то отметки «Нравится» в социальных сетях или перемещение по страницам Интернет-ресурсов, имеют свой «цифровой след», причем, «цифровые следы» пользователей со схожими психологическими качествами также похожи.

Сама возможность прогнозирования психологических качеств по данным социальных сетей обусловлена тем, что психологические качества влияют на «цифровой след», оставляемый пользователем [34]. Исследования [31] показали, что точность прогноза модели машинного обучения может составлять до 0,95, в зависимости от конкретного психологического качества.

Большинство исследований, посвященных прогнозированию психологических качеств по данным социальных сетей, включают в себя психологическую, техническую и математическую компоненты.

В данном исследовании психологическая компонента основана на уже упомянутых психологических качествах, значимых для определения одаренности.

Техническая компонента основана на использовании компьютеризированной методики #Профориентация, которая обеспечивает проведение тестирования на любом персональном компьютере, подключенным к сети Интернет, сбор и анализ данных по результатам тестирования.

Математическая компонента исследования основана на методах машинного обучения. Применение машинного обучения требует определения трех основных составляющих: задач, признаков и моделей.

Аналогично исследованиям [30, 37], в качестве задачи была определена бинарная классификация испытуемых. К положительному классу будут относиться испытуемые, показавшие результаты выше среднего по конкретному психологическому качеству (зависимая переменная равна «1»), к отрицательному – испытуемые с результатами ниже среднего по данному качеству (зависимая переменная равна «0»). Таким образом, прогноз заключался в соотнесении испытуемого с одним из двух классов: с результатами выше и ниже среднего.

Для оценки качества решения задачи бинарной классификации был использован стандартный набор метрик: точность, F-мера и площадь под ROC-кривой.

В качестве признаков были определены пол испытуемых, принадлежность к группам «ВКонтакте», результаты по шкалам методики. Предполагалось, что подписчики определенной группы «ВКонтакте» могут обладать схожими психологическими качествами, что делает возможным использовать принадлежность к группе для прогноза психологических качеств у ее подписчиков. Ранее было показано [21], что принадлежность пользователей к сообществам в социальных сетях Facebook и Twitter может быть использована для прогнозирования психологических качеств подписчиков этих сообществ. Принадлежность к группам, как и тексты, является примером «цифрового следа» пользователя.

В качестве моделей были определены метод опорных векторов, случайные леса и градиентный бустинг. Реализация моделей выполнена при помощи библиотек Python.

Следует отметить, что в данном исследовании построение модели прогнозирования было реализовано для испытуемых с заранее известными характеристиками:

1. Учащиеся старших классов (n=1240, из них: 698 девушек и 542 юноши). Это ограничение позволило упростить моделирование, отказаться от учета специфики пользователей разных возрастов. Кроме того, «ВКонтакте» является наиболее популярной социальной сетью именно среди пользователей-старшеклассников.

2. Учащиеся Томской области. Это ограничение позволило повысить качество моделирования за счет учета региональной специфики.

В зависимости от конкретного психологического качества, выбранная стратегия позволила обеспечить возможность прогноза для 50-76% испытуемых. Для 24-50% испытуемых объем данных оказался не достаточен для прогноза по психологическим качествам.

Сравнение моделей путем расчета площади под ROC-кривой показало, что наиболее эффективной для решения задачи бинарной классификации является модель на основе метода опорных векторов, поскольку значение площади под ROC-кривой для этого метода оказалось набольшим (см. табл. 3).

При расчете площади под ROC-кривой использовалась кросс-валидация, выборка разделялась на пять равных частей, четыре части использовались для обучения модели, одна часть – для тестирования. Разделение выборки повторялось пять раз. Приведенные в табл. 3 результаты расчета площади под ROC-кривой являются усредненными по пяти итерациями обучения и тестирования модели.

Таблица 3

Сравнение моделей машинного обучения по значению площади под ROC-кривой

Шкала субтеста

Метод опорных векторов

Случайные леса

Градиентный бустинг

Аналогии

0,78

0,72

0,76

Дивергентный стиль

0,64

0,60

0,62

Конвергентный стиль

0,70

0,63

0,67

Беглость

0,67

0,61

0,65

Семантическая гибкость

0,69

0,64

0,69

Оригинальность

0,71

0,64

0,69

Креативное поведение

0,71

0,62

0,68

Инициативность

0,69

0,65

0,70

Решительность

0,71

0,67

0,70

Настойчивость

0,68

0,60

0,65

Мотив самореализации

0,76

0,68

0,72

Социальные навыки

0,74

0,69

0,73

Для модели на основе метода опорных векторов была дополнительно рассчитана точность бинарной классификации и F-мера (см. табл. 4).

Таблица 4

Метрики модели на основе метода опорных векторов

Шкала субтеста

Точность

F-мера

Площадь под ROC-кривой

Аналогии

0,75

0,53

0,78

Дивергентный стиль

0,64

0,41

0,64

Конвергентный стиль

0,66

0,59

0,70

Беглость

0,62

0,37

0,67

Семантическая гибкость

0,67

0,57

0,69

Оригинальность

0,67

0,57

0,71

Креативное поведение

0,73

0,39

0,71

Инициативность

0,67

0,59

0,69

Решительность

0,67

0,64

0,71

Настойчивость

0,63

0,65

0,68

Мотив самореализации

0,65

0,76

0,76

Социальные навыки

0,65

0,76

0,74

Таким образом, средняя точность модели прогнозирования составила 0,67. Это дает основания говорить о том, что именно с такой точностью применение методов машинного обучения позволяет идентифицировать испытуемых с высоким уровнем развития психологических качеств и устанавливать положительные и отрицательные связи между уровнем развития у испытуемых определенного качества и их принадлежностью к определенным сообществам в социальной сети.

Обнаружено, что прогнозирование осуществляется как на основе региональных, так и федеральных групп-маркеров. Часть групп-маркеров ориентирована на пол испытуемых (см. табл. 5-9).

Таблица 5

Примеры групп-маркеров для субтеста «Аналогии»

Принадлежность к группе положительно коррелирует с результатом по шкале

Принадлежность к группе отрицательно коррелирует с результатом по шкале

Группа

Количество подписчиков

Группа

Количество подписчиков

E-squire

2623459

АТАШОЛ

1514883

Просветленный 18+

897852

Они тупые?

1281952

Твоя Доза Деградации

417047

КЕКС

958513

Институт Благородных Рокерш

341868

Наука дня

946901

какие-то биохимические мемы

65991

Ti_Shop Одежда в наличии Томск

11004

Абитуриент Томского государственного | ТГУ |

2492

Томские сплетни NEW

5603

Следует отметить, что влияние группы-маркера на прогноз не следует напрямую из ее названия. Так, например, принадлежность к группе «Твоя Доза Деградации» положительно связана с результатом по шкале субтеста «Аналогии», а принадлежность к группе «Наука дня» – отрицательно.

Таблица 6

Примеры групп-маркеров для субтеста «Когнитивные стили»

(шкала «Дивергентное мышление»)

Принадлежность к группе положительно коррелирует с результатом по шкале

Принадлежность к группе отрицательно коррелирует с результатом по шкале

Группа

Количество подписчиков

Группа

Количество подписчиков

Практическая психология

2306945

Мужские мысли

3506768

Странный юмор

1589701

Comedy Club

3005152

Литература

1331898

Бот Анекдот

2254388

Интеллигенция

1245422

IQ – интеллектуальный журнал

1658866

Типичная девушка

1137582

подростки испорченного поколения

1116132

ТОРОБЗО «Содружество», г. Томск

3812

ТПУ | Томский политехнический университет

17811

Таблица 7

Примеры групп-маркеров для субтеста «Опросник креативного поведения»

Принадлежность к группе положительно коррелирует с результатом по шкале

Принадлежность к группе отрицательно коррелирует с результатом по шкале

Группа

Количество подписчиков

Группа

Количество подписчиков

Психология тишины

3039600

Без кота и жизнь не та ツ

3098869

Идеи для творчества и подарков своими руками

3019244

World of Tanks

3048934

Музыка

1695648

Интересные факты и тайны

2029990

Музыкальный бот

522224

Наука и техника

2003497

Типичный творческий

913811

КМД | Королевство Милых Дам

1682457

Музыкальный Томск

1906

Развлечения в Томске

30977

Таблица 8

Примеры групп-маркеров для субтеста «Социальный интеллект»

(шкала «Социальные навыки»)

Принадлежность к группе положительно коррелирует с результатом по шкале

Принадлежность к группе отрицательно коррелирует с результатом по шкале

Группа

Количество подписчиков

Группа

Количество подписчиков

Улыбнуло :D

3379705

Дуревыбивалка

1795156

Академия Порядочных Парней 👑

3269268

Повседневность

1465360

Шпильки | Женский Журнал

1699685

Обман зрения

1267323

Идеи для жизни

1430081

Ожидание & Реальность

673259

Жизнь

1021622

Это мой английский юмор

249698

ВЕСТИ-ТОМСК

6923

РЕШУ ЕГЭ

225669

Таблица 9

Примеры групп-маркеров для субтеста «Мотивы выбора профессии»

(шкала «Мотив самореализации»)

Принадлежность к группе положительно коррелирует с результатом по шкале

Принадлежность к группе отрицательно коррелирует с результатом по шкале

Группа

Количество подписчиков

Группа

Количество подписчиков

Искусство реальности

2691201

Анекдоты

2945138

Читающие

1488119

Дурь ▶

1468814

Сделай сам (рецепты, уют, рукоделие)

1011127

AUTO

1466527

Современное искусство

857486

Европейский Футбол | Спартак – Зенит

1349377

Academic Architecture

212921

Men's Classical

1209323

Вопросяшки в ТГУ

2359

Академия Порядочных Девиц

501066

Таким образом, можно заключить, что применение методов машинного обучения позволяет с удовлетворительной точностью идентифицировать пользователей с высоким уровнем развития психологических качеств, значимых для определения одаренности.

Прогноз по данным социальных сетей не требует предварительного психологического тестирования и может быть подготовлен для испытуемых, с которыми не проводилась какая-либо работа по выявлению одаренности. Другими словами, разработанную в исследовании модель прогнозирования можно применять для определения одаренности у всех старшеклассниках Томской области, не прошедших психологического тестирования для определения одаренности. По «цифровому следу» испытуемых, которым, в частности, является их принадлежность к определенным сообществам в социальной сети, можно прогнозировать уровень развития у них психологических качеств, значимых для определения одаренности.

Выводы

Социальные сети могут быть достаточно эффективно использованы для выявления психологических качеств – интеллектуального, креативного и мотивационно-личностного компонентов одаренности. Применение методов машинного обучения, позволяющего учитывать большое количество испытуемых и признаков, дает возможность с удовлетворительной точностью идентифицировать пользователей социальной сети с высоким уровнем развития определенных психологических качеств и устанавливать связи между этим уровнем и принадлежностью пользователей к определенным сообществам социальной сети.

Новизна данной работы заключается в изучении данных пользователей социальной сети именно для определения одаренности: в отечественных и зарубежных работах представлены результаты анализа данных социальных сетей для исследования и прогнозирования пола, возраста, национальности, психологического типа пользователей, их политических предпочтений, но не одаренности.

Перспективы исследования связаны с возможностями применения методов машинного обучения для проведения масштабного, оперативного, лонгитюдного и менее затратного, по сравнению со стандартным бланковым, тестирования старшеклассников с целью определения значимых для успешной профессиональной реализации качеств и навыков, и отслеживания динамики их развития.

В план следующих исследований входит увеличение количества рассматриваемых в социальной сети признаков: кроме подписок на сообщества учет реакций пользователей в сообществах (отметки «Нравится», репосты), графов социальных связей и авторских текстов на личной странице. Это позволит усложнить модель прогнозирования и повысить ее точность.

Практическое применение разработанной модели прогнозирования заключается в возможности привлечения абитуриентов с выраженным когнитивным и личностным потенциалом. Кроме того, модель может быть использована для определения когнитивных, личностных качеств и компетенций обучающихся с целью проектирования индивидуальных траекторий обучения.

Библиография
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
References
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
Ссылка на эту статью

Просто выделите и скопируйте ссылку на эту статью в буфер обмена. Вы можете также попробовать найти похожие статьи


Другие сайты издательства:
Официальный сайт издательства NotaBene / Aurora Group s.r.o.