Детальная информация
Название | Which Theory of Language for Deep Neural Networks? Speech and Cognition in Humans and Machines // Technology and Language. – 2021. – Т. 2, № 4. — С. 29-60 |
---|---|
Авторы | Capone L. |
Выходные сведения | 2021 |
Коллекция | Общая коллекция |
Тематика | Радиоэлектроника ; Искусственный интеллект. Экспертные системы ; Языкознание ; Применение вычислительной техники в языкознании ; theory of language ; neural networks ; deep neural networks ; natural language processing ; philosophy of language ; psycholinguistics ; теория языка ; нейронные сети ; глубокие нейронные сети ; обработка естественного языка ; философия языка ; психолингвистика |
УДК | 004.8 ; 80:004.3 |
ББК | 32.873 ; 81.1с |
Тип документа | Статья, доклад |
Тип файла | |
Язык | Английский |
DOI | 10.48417/technolang.2021.04.03 |
Права доступа | Свободный доступ из сети Интернет (чтение, печать, копирование) |
Дополнительно | Новинка |
Ключ записи | RU\SPSTU\edoc\76171 |
Дата создания записи | 02.06.2025 |
The paper explores the relationship between technology and semiosis from the perspective of natural language processing, i.e. signs systems automated learning by deep neural networks. Two theoretical approaches to the artificial intelligence problem are compared: the internalist paradigm, which conceives the link between cognition and language as extrinsic, and the externalist paradigm, which understands cognitive human activity as constitutively linguistic. The basic assumptions of internalism are widely discussed. After witnessing its incompatibility with neural network implementations of verbal thinking, the paper goes on exploring the externalist paradigm and its consistency with neural network language modeling. After a thorough illustration of the Saussurian conception of the mechanism of language systems, and some insights into the functioning of verbal thinking according to Vygotsky, the externalist paradigm is established as the best verbal thinking representation to be implemented on deep neural networks. Afterwards, the functioning of deep neural networks for language modeling is illustrated. Firstly, a basic explanation of the multilayer perceptron is provided, then, the Word2Vec model is introduced, and finally the Transformer model, the current the state-of-the-art architecture for natural language processing, is illustrated. The consistency between the externalist representation of language systems and the vector representation employed by the transformer model, prove that only the externalist approach can provide an answer to the problem of modeling and replicating human cognition.
В статье исследуется взаимосвязь между технологией и семиозисом с точки зрения обработки естественного языка, т. е. автоматизированного машинного обучения с помощью глубоких нейронных сетей. Сравниваются два теоретических подхода к проблеме искусственного интеллекта: интерналистская парадигма, которая рассматривает связь между познанием и языком как внешнюю, и экстерналистская парадигма, которая понимает когнитивную деятельность человека как конститутивно лингвистическую. Основные предположения интернализма широко обсуждаются. Убедившись в его несовместимости с нейросетевыми реализациями вербального мышления, в статье продолжается исследование экстерналистской парадигмы и ее согласованности с языковым моделированием нейронных сетей. После тщательной иллюстрации соссюровской концепции механизма языковых систем и некоторого понимания функционирования вербального мышления в соответствии с Л. С. Выготским, экстерналистская парадигма устанавливается как лучшая репрезентация, которая может быть реализована в глубоких нейронных сетях. Далее проиллюстрировано функционирование глубоких нейронных сетей для языкового моделирования. Сначала дается базовое объяснение многослойного персептрона, затем вводится модель Word2Vec и, наконец, проиллюстрирована модель Transformer, современная архитектура для обработки естественного языка. Согласованность между экстерналистским представлением языковых систем и векторным представлением, используемым в модели преобразователя, доказывает, что только экстерналистский подход может дать ответ на проблему моделирования и воспроизведения человеческого познания.
Количество обращений: 15
За последние 30 дней: 15