05.04.2004
Т.Вахобов .Почему машины играют в шахматы хуже человека?
к 55-летию статьи А.Тьюринга "Может ли машина мыслить?"
Когда-то давно, в первой половине XIX века леди Лавлейс (Ada Augusta, the Countess of Lovelace, 1815–1852), дочь английского поэта Байрона, получившая прекрасное образование и изучавшая логику у известного математика Де Моргана, имя которого носит сейчас одна из логических систем математической логики, смогла оценить работу Ч.Бэббиджа (Ch. Babbage, 1792–1871), предложившего идею аналитической машины (Analytical engine), которая должна была проводить вычислительный процесс любой математической функции и выразила это следующими словами: "Аналитическая машина не претендует на то, чтобы создавать что-нибудь действительно новое. Машина может выполнить все, что мы умеем ей предписать.".
Это изречение известно российским читателям как "возражение леди Лавлейс" благодаря переводу статьи А.Тьюринга "Может ли машина мыслить?", впервые опубликованной в 1950 г. под заголовком "Computing Machinary and Intelligence" в английском журнале "Mind".
С этим аргументом леди Лавлейс солидаризуются и критики современного машинного интеллекта. Однако попробую на примере шахматной программы предложить идею, в пользу того, что МАШИНА И В САМОМ ДЕЛЕ МОЖЕТ ДУМАТЬ. Надеюсь, что идея не относится к разряду банальных или устаревших, хотя отдаю себе отчет, что сам пример может показаться несколько надуманным или недостаточно показательным.
В последние годы было проведено несколько поединков шахматных программ с сильнейшими гроссмейстерами мира. Несмотря на примерно ничейный исход сражений по-прежнему в мире бытует уверенность, что программа никогда не сможет сравниться с человеком. На чем строится такая уверенность?
Во-первых, эта уверенность строится на том, что все возможности машины приписывают ее неограниченной по сравнению с человеком памяти, в которую помещаются все известные дебюты, окончания, все партии и прочая полезная информация, анализ которой в полном объеме остается недоступен человеку в ходе игры.
Во-вторых, говорят, что только благодаря своему быстродействию, машина сможет достаточно быстро просчитывать множество вариантов и проводить более глубокий и разветвленный анализ партии, недоступный человеку в связи с физиологическими ограничениями его памяти и скорости обработки информации.
И наконец, в-третьих, скептическое отношение к возможностям шахматных программ исходит из того что, по большому счету, все шахматные программы устроены одинаково. Они используют лишь различные модификации одного и того же метода эвристического поиска и эвристической оценки позиции. Программы анализируют дерево возможных ситуаций, используя обширную базу данных сыгранных партий, собственные оценки каждой позиции и собственные критерии лучшего хода в партии. В то время как человек может придумывать и использовать различные стратегии и тактики, благодаря чему он и играет интеллектуальнее машины, а машина никогда не сможет формировать свое стратегическое поведение.
В принципе, все три аргумента справедливы. Тем не менее, с другой стороны, что же заставляет создателей шахматных программ продолжать свои попытки? Давайте отвлечемся на минуту от коммерческой стороны дела и сконцентрируемся на интеллектуальной сути шахматной программы. Да, создатели программ пытаются заложить в свое детище разнообразные стратегии, тактики и возможность выбора из них. Критики машинного интеллекта возражают на это, что человек все равно более гибок в выборе своего поведения, и машина никогда в этой возможности с ним не сравнится.
Один из моих аргументов в пользу машинного интеллекта строится на использовании идей многоуровневых интеллектуальных агентов и эмоциональной оценки позиции. Сами по себе эти идеи уже не новы, попробую показать, какое они могут иметь отношение к шахматам. Дело в том, что, играя в шахматы, человек использует весь арсенал накопленных им знаний. К их числу относятся и различные поведенческие методы. Стоит ли говорить, что, сев за стол, шахматист явно или неявно начинает их использовать. Он может подумать что-то вроде следующего: "Так вот почему он пошел пешкой 4 хода назад! Я этого не предвидел, это нарушает мои планы. Необходимо перейти к защите, а после отражения угрозы придется форсировать размен, чтобы играть на ничью."
Автор не претендует на знание шахматной психологии, однако подобные рассуждения кажутся вполне правдоподобными. Теперь разберем пример подробнее.
В данном примере налицо наличие эмоциональной оценки вида "сильный ход противника". Налицо также эвристическая оценка собственной позиции, а следовательно и стратегии, как неудовлетворительной. Принимается решение изменить стратегию. Затем выбирается конкретная новая стратегия.
Каждый из этих этапов мышления сам по себе не является чем-то трудным для программной реализации. Трудность возникает тогда, когда надо осуществить непосредственный выбор тактики или стратегии, а также оценивать ходы на предмет того, лежат ли они в русле выбранной стратегии или тактики. Трудность заключается в том, что необходимо либо заранее, до программирования, придумывать различные эффективные тактики и стратегии и закладывать их в программу, либо ... либо программа должна-таки сама! придумывать тактики и стратегии. (Здесь мы оставим в стороне из-за относительной скоротечности поединка попытку учиться у противника, хотя и эту возможность тоже полезно использовать.)
В общем-то, в этих трудностях и кроется основной недостаток существующих шахматных программ. Вполне возможно, что для ликвидации этого недостатка создатели программ идут по следующему пути. Они сначала составляют список тактических и стратегических приемов, используемых известными шахматистами. К числу стратегий можно отнести установки вида "на выигрыш", "на ничью", "атака", "защита" и другие. К тактикам можно отнести приемы вида "предложить размен", "жертва", "пусть слон пока постоит здесь" и т.д. Составив список приемов, закладывают его в программу наряду с базой данных позиций и партий. Основной прием в дальнейшем – это распознать позицию, в которой необходимо произвести смену методов игры. Ведь отдельный ход обычно еще не является методом.
Снова вернемся к сравнению программы с человеком. Как следует из предыдущего абзаца, можно использовать заранее запрограммированный набор "поведенческих актов". Поэтому чем большее их число заранее знает программа, тем более гибко и непредсказуемо она сможет играть. В этом случае "возражение леди Лавлейс" остается в силе – программа не умеет делать ничего нового, по сравнению с тем, что заложил в нее ее создатель. Скорее всего, и это ограничивает машинный шахматный интеллект, "поведенческие акты" программы ограничиваются исключительно специфически шахматным поведением. В то же время, человек вполне способен использовать во время игры и другие аналогии, лежащие на первый взгляд вне шахмат, но которые он может затем приспособить к шахматным нуждам. Воспользовавшись новой аналогией, вполне возможно затем использовать и опыт решения проблем, сопутствующий этой аналогии. В этой связи вспоминается шутка В.Высоцкого: "Это смутно мне напоминает индо-пакистанский инцидент.".
Таким образом, мы подходим к утверждению, что коренное ограничение творческих возможностей шахматных программ кроется в отсутствии того объема и разнообразия поведенческого опыта, которым обладает человек.
Меня могут спросить, при чем здесь многоуровневые интеллектуальные агенты? Ответ заключается в следующем предположении: чем более богатым "поведенческим" опытом обладает программа, тем сильнее она может играть при прочих равных условиях. В частности очень полезно, чтобы в арсенале программы хранились сведения не только о шахматном поведении, но и о поведении в какой-либо другой области, например в игре "крестики-нолики". В идеале, "лишним" личным опытом может обладать каждая фигура в отдельности. Действительно, наверное, обычному шахматисту покажется неожиданной мысль, что одна из пешек противника умеет "мыслить" глубже других (или наоборот – допускать больше ошибок). В этом смысле программа может оказывать на игрока влияние, сравнимое с рефлексивным управлением, заставляя его предполагать наличие у программы дополнительных сюрпризов и отвлекая на это его ресурсы. Ведь известно, что в шахматах часто сама угроза бывает сильнее ее осуществления.
Используя представления о многоагентных адаптирующихся системах (или аналогичные представления о коллективах автоматов), можно предложить, к примеру, следующий вариант. Каждая фигура или пешка рассматриваются как автономный агент, способный действовать не только на шахматной доске, но и в других условиях. В качестве других условий можно использовать следующие условия: все фигуры априори равноценны, но в партии они вынуждены играть разные роли (занимать разные "должности"), они могут уметь играть не только на квадратной доске, играть в виртуальных мирах; они могут уметь играть не только в шахматы, но и, например, участвовать в компьютерных стратегических играх, игры могут происходить с участием не только двух сторон, но и многих сторон и так далее. Чем более разнообразным окажется поведенческий опыт фигур, тем больше разнообразных аналогий сможет породить шахматная программа во время игры (порождение аналогий становится в настоящее время рутинной процедурой систем искусственного интеллекта). Да и просто инициальный запас стратегий у нее повысится. Как минимум этих способностей, на мой взгляд, не хватает сегодняшним шахматным программам.
Возражение о юных шахматных дарованиях, которые якобы не обладают должным жизненным опытом, не является существенным, поскольку оно качественно не противоречит сказанному: в детстве все мы так или иначе общались с окружающими, а мозговые структуры юных шахматистов могут быть генетически лучше других приспособлены именно к шахматной деятельности.
Заключение
Основное утверждение данной статьи заключается в том, что коренное ограничение творческих возможностей шахматной программы кроется в ее "бедном" поведенческом опыте по сравнению с человеком.
Затем предложены некоторые идеи, позволяющие программам приобрести дополнительный игровой и иной поведенческий опыт, "расширить" свой кругозор. Использование многоагентных систем само по себе не является абсолютно новыми. В практике решения задач искусственного интеллекта эти идеи особенно интенсивно разрабатываются в течение последних лет, хотя первые работы на эту тему имеют 40-летнюю или более историю.
Причины, ограничивающие возможности программ, рассмотренные в анализе, а также выдвинутые предложения являются гипотезами и не проверены автором на практике. Кроме того, авторский анализ шахматных программ не претендует на полноту и всесторонность.
Большинство сказанного про шахматы также можно отнести и к программам искусственного интеллекта.
В этой статье автор не пытался показать, как в действительности можно добиться, чтобы машина мыслила (и что такое мышление). Однако использование для этого ментальных поведенческих актов (стратегий, тактик и других психологических функций) представляется совершенно необходимым, что по мысли автора подтверждается шахматным примером.
С автором можно связаться по электронной почте: aiforum@yandex.ru
Москва, Вахобов ТА.
01.03.2004