Мова асемблера

Мова програмування низького рівня

Мова асемблера (англ. assembly language) — мова програмування низького рівня для програмованої обчислювальної системи (мікропроцесора, мікроконтролера, комп'ютера або іншого програмованого пристрою), в якій існує сувора відповідність між операторами мови та машинними командами[2]. Асемблер також називають символічним машинним кодом або мнемокодом.

Мова асемблера
Парадигма неструктуроване програмуванняd
Дата появи 1949
Звичайні розширення файлів .asm або .s[1]
CMNS: Мова асемблера у Вікісховищі
Лістинг Motorola MC6800 Assembly, який показує оригінальний текст програми та згенеровані машинні коди

Кожна мова асемблера специфічна для конкретної комп'ютерної архітектури. На відміну від цього, програми на мовах програмування високого рівня, як правило, здатні виконуватися на декількох архітектурах, хоча вимагають специфічної для платформи інтерпретації або компіляції.

Програма мовою асемблера перетворюється у виконуваний машинний код за допомогою програми-асемблера. Процес перетворення називають асемблюванням або збіркою (англ. assembly, assembling). У більшості випадків цей процес відбувається у два етапи: асемблювання і компонування[3] (англ. linking).

Асемблер ред.

Докладніше: Асемблер

Асемблер (англ. assembler — складальник) — комп'ютерна програма, що генерує об'єктний двійковий код з заданої (як правило у текстовому вигляді) послідовності машинних інструкцій. Кожна інструкція має свою мнемоніку, і складається з символічної назви (наприклад, MOV — від англ. move, «перемістити»), за якою опціонально можуть слідувати операнди. Асемблер також обчислює значення констант і здійснює резолвінг символічних імен (і, якщо потрібно, записує у об'єктний файл адреси, які потрібно модифікувати під час компонування чи завантажування програми).[4] Використання символьних посилань і автоматизація обчислень адрес є однією з ключових особливостей асемблера, яка звільняє програміста від кропітких ручних обчислень (які доводилося б робити навіть при додаванні чи вилученні однієї інструкції програми). Більшість асемблерів також мають макрокоманди, що дозволяють замінювати у програмі повторювані фрагменти коду викликом макроса.

У простому випадку асемблер переводить одну операцію (машинну команду з параметрами) початкової програми у відповідний машинний код (так звана трансляція «один в один»). При цьому взаємне розташування кодів інструкцій у об'єктному модулі визначається порядком операцій у початковій програмі і повністю залежить від програміста. Для розширення можливостей низькорівневого програмування асемблери можуть реалізовувати підтримку макрокоманд — груп команд, що можуть вставлятися до програми потрібну кількість разів. В цьому випадку перед трансляцією проводиться заміна макрокоманд макророзширеннями — послідовностями команд на базовій мові відповідно до макроозначень. У останніх задається прототип макрокоманди зі структурою списку параметрів і процедура генерування макророзширення. Транслятор, що виконує функції макрогенератора і асемблера, називається макроасемблером. При трансляції з мов високого рівня асемблер нерідко використовується для виконання завершальної фази трансляції.

Трансляція зазвичай вимагає двох переглядів початкової програми: при першому перегляді здійснюється розподіл пам'яті і надання значень символічним іменам; при другому — формується робоча програма у вигляді об'єктного файлу. В процесі трансляції асемблер проводить повний синтаксичний контроль початкової програми, забезпечуючи при цьому достатньо точну діагностику помилок за місцем і характером.

Вважається[ким?], що мова асемблера є низькорівневою (на противагу мовам програмування високого рівня, що частково чи повністю абстрагуються від деталей реалізації команд процесора). Чим нижчий рівень мови програмування, тим ближча специфіка роботи програми до самого процесора, для якого вона й була написана. Вважається[ким?], що мови низького рівня складніші й потребують більш вузької спеціалізації програміста, оскільки програма написана на асемблері для одного типу процесорів виявиться не завжди придатною для роботи з іншими процесорами. З іншого боку, програми написані на асемблері компактні та швидкі, що теж важливо.

Опис мови асемблера ред.

Команди мови асемблера відповідають машинним кодам відповідного мікропроцесора чи мікроконтролера. Фактично, мова асемблера являє собою зручнішу символьну форму запису машинних команд. Як наслідок, програми написані для одного типу процесорів, на іншому не будуть функціонувати. Мова асемблера також містить засоби для створення міток та переходів, що необхідно для створення циклів та розгалужень. Можуть бути наявні засоби для створення макросів, процедур. Кожне сімейство (модельний ряд) мікропроцесорів має свій набір команд і, відповідно, свій набір інструкцій на мові асемблера.

Переваги і недоліки ред.

  • мінімальна кількість надлишкового коду (використання меншої кількості команд та звернень в пам'ять). Як наслідок — велика швидкість і менший розмір програми;
  • великі обсяги коду, велике число додаткових дрібних завдань;
  • погана читабельність коду, труднощі підтримки (налагодження, додавання можливостей);
  • труднощі реалізації парадигм програмування та будь-яких інших скільки-небудь складних конвенцій, складність спільної розробки;
  • меншу кількість доступних бібліотек, їх мала сумісність;
  • безпосередній доступ до апаратури: портам введення-виведення, особливим регістрам процесора;
  • максимальна «підгонка» для потрібної платформи (використання спеціальних інструкцій, технічних особливостей «заліза»);
  • неможливість роботи на платформах з іншою (несумісною) архітектурою.

Директиви ред.

Крім інструкцій, програма може містити директиви: команди, що не переводяться безпосередньо в машинні інструкції, а керують роботою компілятора. Набір і синтаксис їх значно різняться і залежать не від апаратної платформи, а від використовуваного компілятора (породжуючи діалекти мов в межах одного сімейства архітектур). Як набір директив можна виділити:

  • визначення даних (констант і змінних);
  • керування організацією програми в пам'яті і параметрами вихідного файлу;
  • завдання режиму роботи компілятора;
  • всілякі абстракції (тобто елементи мов високого рівня) — від оформлення процедур і функцій (для спрощення реалізації парадигми процедурного програмування) до умовних конструкцій і циклів (для парадигми структурного програмування);
  • макроси.

Використання мови ред.

Історичні відомості ред.

Мови асемблера, так само як і використання слова assembly, беруть свій початок від перших ЕОМ зі збереженням програми. Один з перших асемблерів було розроблено у 1947 році Катлін Бут (Kathleen Booth) для машини ARC2 в університеті Біркбек (Лондон), після консультацій з Джоном фон Нойманом і Германом Ґолдстіном у Інституті перспективних досліджень.[5][6] Машина EDSAC у 1949 році мала асемблер під назвою initial orders з однолітерними мнемоніками.[7] Для машин IBM 650 існувала програма SOAP (Symbolic Optimal Assembly Program), написана Стеном Полі (Stan Poley) у 1955-му.[8]

Мови асемблера дозволили вивільнити програмістів від надзвичайно низькорівневих, рутинних і втомливих «ручних» процедур, яких потребували перші комп'ютери —запам'ятовування людиною кодів команд, адрес, ручного обчислення адрес переходів (і зміни їх при кожному додаванні чи вилученні команд), представлення чисел тощо. Приблизно до середини 1980-х років асемблери широко використовувалися у програмуванні — як для великих ЕОМ (мейнфреймів), так і для персональних і мікрокомп'ютерів. Втім, прогрес у розвитку процесорів і пам'яті спричинив активний прогрес методів компіляції з високорівневих мов і появу компіляторів, що значно підвищували продуктивність роботи програміста. У 21-му столітті мови асемблера використовуються там, де потрібне пряме керування апаратурою, доступ до спеціалізованих інструкцій процесора чи співпроцесорів, або для кодування критичних (до часу чи розміру) секцій програми. Типовими сферами застосування асемблера є драйвери пристроїв, вбудовані системи, системи реального часу, ядра ОС, резидентні монітори тощо.

Багато важливих програм було написано цілком на мові асемблера (лише у 1961-му з'явилася перша операційна система Burroughs MCP, написана частково на мові високого рівня (алголоподібний ESPOL)). Велика кількість комерційного програмного забезпечення для мейнфреймів IBM також написана на асемблері.

Більшість ранніх мікрокомп'ютерів, обмежених у оперативній пам'яті, потребувало програмного забезпечення, написаного вручну майже виключно на асемблері, включно з кодом BIOS, дискової операційної системи і великої кількості прикладних програм. Типовими прикладами великих асемблерних програм 1970-80-х років є BIOS і DOS для комп'ютерів IBM PC, компілятор Turbo Pascal, перші програми електронних таблиць (наприклад, Lotus 1-2-3), численні комп'ютерні ігри.

Застосування у нинішній час ред.

З часів винаходу перших компіляторів йшли дебати щодо доцільності використання мови асемблера у програмуванні прикладних задач. Втім, системне програмування завжди лишалося особливою нішею, де асемблер був і залишається важливим.

Мови асемблера досі вивчаються на більшості курсів інформатики і електроніки та мікропроцесорної техніки. Фундаментальні поняття, такі як двійкова арифметика, керування пам'яттю, стек, кодування символів, переривання, проєктування компіляторів тощо можуть бути повністю осягнені людиною лише при ґрунтовному розумінні роботи комп'ютера на апаратному рівні, що неодмінно передбачає розуміння набору команд і адресації процесора.

Приклади застосувань ред.

  • Гіпервізори
  • Реалізація криптографічних і інших специфічних алгоритмів (наприклад, цифрового перетворення сигналів)
  • Фрагменти ядер ОС, або цілі мікроядра (приклади: ранні L3, L4)
  • Початкові завантажники, Firmware, резидентні монітори, BIOS
  • Результат роботи компілятора (коли компілятор генерує не об'єктний код, а текст на мові асемблера), який можна переглянути і при потребі змінити
  • Inline-інтегрування асемблерних команд безпосередньо в тіло програми на мові високого чи середнього рівня (C, Паскаль)
  • Низькорівневі віруси чи руткіти
  • Машинний код, що модифікує сам себе
  • Реверс-інженеринг
  • Програми, повністю незалежні від основних системних бібліотек (таких як libc чи crt0)
  • Різні типи оптимізації, що з тих чи інших причин недоступні при кодуванні на мові високого рівня

Приклади ред.

Приклади програми Hello, World! для різних платформ і асемблерів.

EXE-програма на TASM для MS-DOS, платформа Intel x86

  • tasm hello.asm
  • tlink hello.obj
.model small                    ; модель пам'яті
.data                           ; сегмент даних
msg db 'Hello, World',13,10,'$' ; текстове повідомлення

.code                           ; сегмент коду
start:                          ; точка входу в програму 
        mov ax, @data           ; налаштування сегментного
        mov ds, ax              ; регістра даних
        mov ah, 09h             ; функція DOS № 9 – вивести рядок
        lea dx, msg             ; адреса текстового повідомлення
        int 21h                 ; виклик переривання DOS
        mov , 4Ch             ; Функція DOS № 4Ch – завершити програму 
        mov al, 0               ; код повернення 0
        int 21h                 ; виклик переривання DOS
end start

Програма на FASM для MS-DOS

org 100h                   ;зсув на 100h байт
.model tiny                ;модель пам'яті
.data                      ;сегмент даних
print db "hello world!$"   ;рядок, який треба вивести
.code                      ;сегмент коду

mov ah, 9                  ;функція MS-DOS номер 9 - вивести рядок
mov dx, offset print       ;запис в регістр dx адреси першого байту рядку print
int 21h                    ;виклик 21-го переривання MS-DOS
ret                        ;Повернення контролю операційній системі

Програма на NASM для Linux, платформа Intel x86

  • nasm –f elf –o hello.o hello.asm
  • ld -o hello hello.o
SECTION .data                   ; сегмент даних
msg  db "Hello, world!", 10     ; текстовий рядок
len     equ $ - msg             ; довжина рядка

SECTION .text                   ; сегмент коду
global _start
_start:                         ; точка входу в програму                      
        mov eax, 4              ; системний виклик № 4 (sys_write)
        mov ebx, 1              ; номер пристрою (stdout)
        mov ecx, msg            ; текстове повідомлення
        mov edx, len            ; довжина повідомлення
        int 0x80                ; виклик ядра
        mov eax, 1              ; системний виклик № 1 (sys_exit)
        mov ebx, 0              ; код повернення 0
        int 0x80                ; виклик ядра

Програма на асемблері 6502 для Apple II

*********************************
*     HELLO WORLD FOR 6502      *
*   APPLE ][, MERLIN ASSEMBLER  *
*********************************

STROUT 	EQU     $DB3A           ; виводить текстовий рядок, адресований AY
        LDY     #>HELLO         ; завантажити старшу частину адреси тексту в регістр Y
        LDA     #<HELLO         ; завантажити молодшу частину адреси тексту в регістр A
        JMP     STROUT          ; перейти на підпрограму виведення рядка

HELLO	ASC	"HELLO WORLD!",00

Див. також ред.

Джерела ред.

Примітки ред.

  1. https://cs.lmu.edu/~ray/notes/x86assembly/
  2. Дудзяний І. М., Черняхівський В. В. Програмування мовою асемблера. — Львів: ЛНУ імені Івана Франка, 2002.
  3. Магда Ю. С. Ассемблер для процессоров Intel Pentium. — СПб.: Питер, 2006.
  4. David Salomon (1993). Assemblers and Loaders (англ.). Архів оригіналу за 23 березня 2020. Процитовано 12 січня 2018. 
  5. Booth, A.D.; Britten, K.H.V. (September 1947). Coding for the ARC. Birkbeck College, London. Архів оригіналу за 24 березня 2020. Процитовано 23 липня 2017. 
  6. Campbell-Kelly, Martin (April 1982). The Development of Computer Programming in Britain (1945 to 1955). IEEE Annals of the History of Computing. 4 (2): 121–139. doi:10.1109/MAHC.1982.10016. 
  7. Salomon. Assemblers and Loaders. с. 7. Архів оригіналу за 23 березня 2020. Процитовано 17 січня 2012. 
  8. The IBM 650 Magnetic Drum Calculator. Архів оригіналу за 15 лютого 2020. Процитовано 17 січня 2012. 

Посилання ред.