EMAS
EMAS jest assemblerem skrośnym dla MERRY 400, używającym, w odróżnieniu od ASSEM, składni bliższej współczesnym assemblerom, oraz mnemoników MERY 400 (ale bez przyrostków zależnych od lokalizacji argumentu, patrz: Lista rozkazów).
Wywołanie
Wywołanie EMAS z linii poleceń ma postać:
emas [opcje] [wejście]
Gdzie:
- wejście - nazwa wejściowego pliku źródłowego. Jeśli nie zostanie podana, EMAS czyta program ze standardowego wejścia
- opcje - dowolne z:
- -o <wyjście> - nazwa wyjściowego pliku binarnego. Jeśli nie zostanie podana, przyjmowana jest nazwa a.out
- -O <otype> - typ pliku wyjściowego. Możliwe wybory to:
- raw - binarny obraz gotowy do umieszczenia w pamięci i uruchomienia
- debug - plik tekstowy opisujący zawartość kolejnych komórek pamięci (przydatny w przypadku programowania komputera z pulpitu technicznego)
- emelf - konsolidowalny obiekt EMELF (domyślny wybór)
- -c <cpu> - wybierz procesor, dla jakiego assembler produkuje binaria. Możliwe wybory to: mera400, mx16. Ustawienie procesora na MX-16 pozwala na użycie dodatkowych instrukcji oraz poszerza przestrzeń adresową programu z 32 do 64k słów. Domyślnie przyjmowany procesor to mera400.
- -I <katalog> - dodaj katalog do listy katalogów, w których poszukiwane będą pliki dołączane dyrektywą .include
- -v - wyświetl informacje o wersji i zakończ działanie
- -h - wyświetl pomoc i zakończ działanie
- -d - drukuj informacje przydatne w śledzeniu błędów działania asemblera
Opis języka
Komentarze
EMAS pozwala na użycie komentarzy jedo- i wieloliniowych:
; samotny komentarz jednoliniowy lw r1, 2 ; komentarz jednoliniowy na końcu dowolnej linii /* komentarz wieloniniowy */ lw r1, 2 /* komentarz wieloliniowy, choć tak naprawdę w jedej linii */ /* można też tak */ lw r1, 2
Stałe
Stałymi w programie mogą być liczby całkowite, liczby zmiennoprzecinkowe oraz łańcuchy znaków.
Liczby całkowite
Liczby całkowite można zapisywać w systemie binarnym, ósemkowym, dziesiętnym lub szesnastkowym, np:
0b1101110000 0177 -931 0xffa9
Istnieje jeszcze jeden sposób zapisu stałych całkowitoliczbowych, wynikający z ułożenia wskaźników w rejestrze R0, gdzie poszczególnym bitom przypisany jest jednoliterowy symbol ze zbioru (Z, M, V, C, L, E, G, Y, X). Można dzięki niemu zapisać liczbę szesnastobitową z ustawionymi na 1 bitami, które odpowiadają danym wskaźnikom. Przykłady takiego zapisu stałych:
?ZM ?GVZ
Wewnętrznie EMAS operuje na 32-bit liczbach ze znakiem. Kiedy ostateczna wartość będąca wynikiem operacji ma zostać umieszczona w obiekcie wynikowym, jej zakres jest sprawdzany i użytkownik jest informowany o ewentualnym jego przekroczeniu. Wyjątkiem jest argument dyrektywy .dword, który jest 32-bit liczbą w kodzie U2.
Znaki
EMAS pozwala na zapisywanie stałych całkowitoliczbowych również przy pomocy znaków, dwuznaków lub trójznaków. Znaki pojedyncze oraz dwuznaki obejmują cały zakres znaków ASCII i można je podawać również używając sekwencji unikowych. Trójznaki pozwalają kodować jedynie znaki poprawne dla kodu R40.
Znaki w pojedynczych cudzysłowach:
'a', '\n', '\xa1', '\0177'
kodowane są jako ich wartość w kodzie ASCII na młodszym bajcie słowa. Dwuznaki:
'ab', '\r\n', '\xaa\0001'
kodowane są jako wartości podanych znaków w kodzie ASCII odpowiednio na starszym i młodszym bajcie słowa. Trójznaki:
'abc', 'XYZ', '#_1'
kodowane są w słowie za pomocą kodu R40.
Liczby zmiennoprzecinkowe
Akceptowane są następujące sposoby zapisu liczb zmiennoprzecinkowych:
9 1.2 0.003 -9.125e-2 1e4
Jedynym miejscem w programie, w którym może wystąpić liczba zmiennoprzecinkowa, jest argument dyrektywy .float.
Łańcuchy
Łańcuchy znaków są ciągami znaków ujętymi w podwójne cudzysłowy. Poszczególne znaki można zapisywać dosłownie, lub (w przypadku dyrektyw .ascii i .asciiz) używając jednej z sekwencji unikowych:
- \0yyy - gdzie yyy jest ósemkowym kodem znaku
- \xyy - gdzie yy jest szesnastkowym kodem znaku
- \y - umożliwia zakodowanie jednego znaków specjalnych (wartości y inne niż poniżej są niepoprwane):
- \n - nowa linia
- \t - tabulacja pozioma
- \r - powrót karetki
- \f - wysuw strony
- \\ - dosłowny ukośnik w tył
- \" - dosłowny podwójny cudzysłów
Przykłady poprawnych łańcuchów znaków:
"MERA-400\n" "\xab\xac\xad" "\"napis\""
To, w jaki sposób znaki umieszczane są w programie wynikowym zależy od dyrektywy, której łańcuch jest argumentem.
Bieżąca lokalizacja
Specjalną stałą jest "." (kropka), która w danym miejscu programu zawsze zwraca przesunięcie względem początku assemblowanego obiektu. Jej wartość jest zawsze >= 0.
Symbole
Symbolem jest ciąg znaków zaczynający się od małej lub dużej litery, z następującą dowolną ilością małych lub dużych liter, liczb lub znaku podkreślenia. Symbolowi przypisywana jest w trakcie asemblacji wartość oraz atrybuty. Symbol może być:
- niezdefiniowany - wystąpiła deklaracja symbolu, ale nie został on (jeszcze) zdefiniowany,
- lokalny lub globalny - widoczny tylko w granicach obiektu, w którym występuje, bądź również poza nim,
- zmienny lub stały - wartość symbolu może, bądź nie może ulec zmianie w trakcie asemblacji programu.
Symbol otrzymuje atrybuty zgodne z tym w jakim kontekście został zdefiniowany bądź zadeklarowany.
Zmienne assemblera
Zmienne assemblera nie mają swojej reprezentacji w wynikowym obiekcie, są wartościami dostępnymi w trakcie asemblacji programu, a definiuje się je dyrektywą .equ. Symbol, który jest zmienną assemblera jest zawsze zmienny. Przykłady zmiennych:
.equ a 10 .equ b a+2
Stałe assemblera
Stałe assemblera również nie mają swojej reprezentacji w wynikowym obiekcie, są wartościami dostępnymi w trakcie asemblacji programu, a definiuje się je dyrektywą .const. Symbol, który jest zmienną assemblera jest zawsze stały. Przykłady stałych:
.const a 10 .const b a+9
Etykiety
Etykieta opisuje pozycję względem początku obiektu (jest nią wartość licznika rozkazów w danym momencie asemblacji). Przykład definicji etykiety:
etykieta:
Zasięg symboli
Wszystkie symbole definiowane są jako lokalne. Jeśli symbol ma być widoczny dla konsolidatora, należy go zadeklarować jako globalny dyrektywą .global. Zmiana zasięgu może nastąpić przed, lub po definicji:
.global printf .global snprintf .global strdup
printf: ... snprintf: ... strdup:
procedura: .global procedura
Wyrażenia
Operatory
Poniższa tabela przedstawia operatory arytmetyczne i bitowe, w kolejności malejących priorytetów
Operatory | Działanie |
---|---|
~ | negacja bitowa |
\ | skalowanie |
*, /, % | mnożenie, dzielenie, reszta z dzielenia |
+, - | dodawanie, odejmowanie |
<<, >> | przesunięcie bitowe w lewo i w prawo |
&, |, ^ | logiczny iloczyn, suma i suma wykluczająca |
Operator skalowania realizuje funkcję dokładnie taką samą, jak przesunięcie bitowe, jest tylko innym sposobem jego zapisu. Poniższe zapisy są równoznaczne:
3\7 = 3 << (15-7)
Skalowanie można rozumieć jako: "umieść liczbę 3 od 7 pozycji bitowej w górę. Bity dla tego zapisu numerowane są od 0 (bit najstarszy) do 15 (bit najmłodszy). Wynikiem będzie więc liczba:
0000001100000000
Dyrektywy assemblera
.cpu
Składnia: .cpu <mera400|mx16>
Odpowiednik przełącznika -c linii poleceń EMAS-a. Pozwala określić typ procesora, dla którego ma być generowany kod wynikowy. Użycie mx16 sprawia, że:
- mnemoniki CRON, SINT, SIND są rozpoznawane i poprawnie assemblowane
- maksymalny rozmiar wynikowego pliku binarnego wynosi 64k słowa (32k dla mera400)
.file
Składnia: .file nazwa_pliku
Ustala nazwę assemblowanego pliku. Jeśli assembler będzie chciał użyć w komunikatach nazwy pliku, to domyślna nazwa (zgodna z nazwą assemblowanego pliku) zostanie od momentu wydania dyrektywy zastąpiona podaną.
.line
Składnia: .line numer_linii
Ustala numer bieżącej linii assemblacji (poczynając od linii następującej po dyrektywie). Dalsze linie będą numerowane kolejno od podanej wartości.
.include
Składnia: .include nazwa_pliku
Powoduje dołączenie do assemblacji pliku o podanej nazwie.
.equ
Składnia: .equ nazwa_zmiennej wartość
Ustala wartość zmiennej assemblacji. Może być ona w dalszej części programu zmieniana.
.const
Składnia: .const nazwa_zmiennej wartość
Ustala wartość stałej assemblacji. Wartość ta nie może ulec zmianie.
.lbyte
Składnia: .lbyte liczba_8_bit [, ...]
Zapisuje w programie wynikowym na lewych pozycjach (MSB) kolejnych słów podane wartośći 8-bit.
.rbyte
Składnia: .rbyte liczba_8_bit [, ...]
Zapisuje w programie wynikowym na prawych pozycjach (LSB) kolejnych słów podane wartośći 8-bit.
.word
Składnia: .word liczba_16_bit [, ...]
Zapisuje w programie kolejne słowa 16-bit o podanej wartości.
.dword
Składnia: .dword liczba_32_bit [, ...]
Zapisuje w programie wynikowym pary słów 16-bit tworzące podaną liczbę 32-bit.
.float
Składnia: .float liczba_zmiennoprzecinkowa [, ...]
Zapisuje w programie wynikowym trójki słów 16-bit tworzące podaną 48-bit liczbę zmiennoprzecinkową w notacji używanej przez arytmometr wielokrotnej precyzji MERY-400.
.ascii
Składnia: .ascii łańcuch
Zapisuje w programie wynikowym podany łańcuch, kodując go po dwa znaki ASCII na słowo maszynowe.
.asciiz
Składnia: .asciiz łańcuch
Zapisuje w programie wynikowym podany łańcuch, kodując go po dwa znaki ASCII na słowo maszynowe. Łańcuch terminowany jest 8-bit wartością '0'.
.r40
Składnia: .r40 łańcuch_r40
Zapisuje w programie wynikowym podany łańcuch, kodując go po trzy znaki R40 na słowo maszynowe. UWAGA: W kodzie R40 można użyuwać jedynie liter, liczb i znaków specjalnych: _, #, %.
.res
Składnia: .res rozmiar [,liczba_16_bit]
Rezerwuje w programie wynikowym obszar o podanym rozmiarze (w słowach), wypełniając go zerami. Jeśli podany jest drugi argument, jego wartość używana jest do wypełnienia zamiast zera.
.org
Składnia: .org adres
Ustala nową bieżącą pozycję assemblacji. Następne wygenerowane słowo zostanie umieszczone już pod podanym, nowym adresem.
.entry
Składnia: .entry adres
Dyrektywa ma efekt wyłącznie w przypadku generowania pliku wynikowego jako obiektu EMELF. Określa adres wejścia do programu.
.global
Składnia: .global nazwa_etykiety
Dyrektywa ma efekt wyłącznie w przypadku generowania pliku wynikowego jako obiektu EMELF. Wskazuje, że etykieta będzie miała zasięg globalny.