2025년 10월 8일 수요일

SLT-Turbo 제작 #16 - Z80 확장명령

1) Z280 호환 명령


turboR 호환기를 만들기 위해서는 R800에 추가된 곱셈 명령도 구현이 필요합니다.

SLT-Turbo V1에서는 Z280을 활용했지만, 이번에는 그냥 CPLD의 도움으로 처리했어요.


Z80 명령어 ED C0 ~ ED FF, 총 64개 명령어 공간을 사용합니다.

오리지널 Z80에서 이 명령어를 쓰면 그냥 무시됩니다. NOP 명령을 2개 쓴 효과랑 같아요.


참고로, Z280의 경우는 이 영역 대부분이 확장 명령어로 들어 있습니다.

8bit 곱셈/나눗셈, 16bit 곱셈/나눗셈, signed/unsigned 다 있죠.


R800은 unsigned 8bit, 16bit 곱셈 명령어 중에서 극히 일부인 6개만 들어가는데요,

SLT-Turbo에서는 unsigned 곱셈 명령어 10개를 넣었습니다.


ED C1 ; MULUB  A,  B -> HL ; Z280/R800

ED C3 ; MULUW HL, BC -> DE:HL ; Z280/R800

ED C9 ; MULUB  A,  C -> HL ; Z280/R800

ED D1 ; MULUB  A,  D -> HL ; Z280/R800

ED D3 ; MULUW HL, DE -> DE:HL ; Z280

ED D9 ; MULUB  A,  E -> HL ; Z280/R800

ED E1 ; MULUB  A,  H -> HL ; Z280

ED E3 ; MULUW HL, HL -> DE:HL ; Z280

ED E9 ; MULUB  A,  L -> HL ; Z280

ED F3 ; MULUW HL, SP -> DE:HL ; Z280/R800


한가지 주의할 부분은 이 곱셈 명령어들의 결과 flag 처리는 넣지 않습니다요.

(사실 곱셈결과에 의미있는 flag가 없...ㅋ)

간단한 테스트 프로그램으로 곱셈 결과가 맞는지 확인해보아요~



그나저나, turboR이 나온지 거의 35년이 됐는데, R800 곱셈을 쓰는 상용프로그램이 없다는 게 참 신기하죠?

제가 만든 ASO remake가 유일한 R800 테스트 프로그램이라고 볼 수 있겠는데요.

지난번 동작하는 영상을 보셨을테니 ASO는 넘어갑니다~ ㅎ.ㅎ



2) X-II BIOS 확장


X-II의 BIOS는 롬영역을 다 쓰고 있어서, 추가 코드를 넣을 공간이 없습니다.

심지어 BIOS 엔트리까지 다 잡아먹고 있죠. (역시 내일이 없는 회사ㅋ)


CHGGPU(0180H), GETCPU(0183H) 루틴을 명령어 하나로 대체하도록 해봤습니다.

ED FE ; CHGCPU

ED FF ; GETCPU


원래 BIOS 엔트리는 JP NN 코드(3바이트)를 넣게 되어있는데,

확장 명령어가 2바이트니까 RET 명령까지 다 넣으면 딱 3바이트로 끝나게 됩니다.

아래처럼 되겠네요 ㅎ.ㅎ



음... 사실 굳이 이렇게 만들 필요는 없는데요.

예전 paraMSX-R과 MMC/SD V4에서는 BIOS롬을 뱅킹으로 처리해서 코드를 확장하긴 했었죠 ㅎ.ㅎ



3) 고속 LDIR


Z80에서는 LDIR, OTIR의 비중이 큰데요.

OTIR, OUTI 등의 경우는 주변장치의 속도(VDP 등)때문에 고속으로 최적화할 여지가 별로 없겠구요.

LDIR은 LDI x N개로 풀어(unroll)쓰는 걸 많이 사용합니다.

메모리 여유가 있다면 루프 명령을 쓰는 것 보다는 많이 빠르니까요.


물론 기존 디스크롬들은 이미 다 적용이 되어있죠.

지금 해보려는 건... 고속모드에서 더 빠르게 돌리기 위해 메인램에서 코드를 구동하는 것입니다.


요약하면, '외부 슬롯의 코드에서 LDI x N 풀어쓰기가 필요할 때 메인램에서 구동'입니다.


일단 2개의 명령어를 만들어봤어요.

ED CF ; LDIR

ED DF ; LDIR256


ED CF는 기존 LDIR과 똑같은 기능이지만 속도만 더 빠른 버전이구요.

실제로는 RAM에서 LDI x 32개로 풀어진 명령어로 최적화가 됩니다.


ED DF는 LDIR 수행 시 반복(루프)를 256 배수일 때 쓰면 더 빠른 버전입니다.

실제로는 RAM에서 LDI x 256개가 루프를 돌게 됩니다요.

보통 디스크에서 섹터를 읽게 되면 1섹터 512바이트씩 전송을 하니까 이 경우 꽤 쓸모가 있어요.


turboR에서는 MMC/SD V4로 DOSSCAN을 돌려보면 520~540KB/s 정도가 나오는데요.

SLT-Turbo + V4에서 구동하면 470KB/s 정도가 나옵니다.

이걸 LDIR 최적화 명령어를 이용하면 560KB/s 수준으로 빨라지게 됩니다.

아래 사진 참고하세요.




그럼, 다음편에서 보아요~


2025년 10월 3일 금요일

SLT-Turbo 제작 #15 - MIDI

GT의 미디 인터페이스를 구현하려면, UART Tx/Rx 및 i8253 타이머가 필요합니만...

SLT-Turbo에서는 출력용 필수기능만 넣어봅니다ㅋ


MIDI OUT (Tx) -> 포함

MIDI IN (Rx)  -> 제외

i8253 Counter 0 -> UART baudrate 고정

i8253 Counter 1 -> 제외

i8253 Counter 2 -> 포함

... 요렇게 되겠습니다.


문득 25년 전의 추억이 떠오르네요.

paraMSX에 turboR GT 에뮬을 넣을 때, 미디 H/W 정보가 없어서 걍 포기하고,

타이머를 안쓰는 WSX의 MusicROM을 넣어서 돌리고 그랬죠. 짭ST 느낌? ㅎ.ㅎ


암튼 SLT-Turbo에는 MIDI OUT 커넥터만 하나만 들어있으니, 좋아하시는 미디 모듈을 붙여주시면 되겠네요.

저는 SC-88VL과 mt32-pi를 연결해서 쓰고 있습니다.


미디는 더 설명이 필요없네요. 아래 영상으로 구경하세요~

MIDRY 플레이, 문라이트사가 오프닝은 SC-88VL의 사운드이구요,

뒤의 환영도시 오프닝은 mt32-pi의 사운드입니다. (mt32-pi가 좀 버벅거려서 음이 가끔 튀니까 참고하시고...)





그럼, 다음편에서 보아요~


2025년 9월 28일 일요일

SLT-Turbo 제작 #14 - 외부 슬롯 (SLT-X)


먼저 지난 글에서 알려드린 X-II 모드에서, 바뀐 부분을 알려드립니다.


X-II 모드에서는 메인램이 SLOT 0-2에 배치되어있고,

고속모드는 ROM모드까지만 지원되는 것으로 설정했었는데요.

아무래도 기존 turboR용 S/W를 사용할 때 CPU 모드 전환이 불편할 것 같아서,

그냥 GT모드와 동일하도록 메인램을 SLOT 3-0으로 옮겼습니다.

Shadow RAM도 GT모드와 비슷하게 정리했습니다.

결국 고속모드 ROM/RAM 모두 가능합니다.


메인 BIOS에는 2+/turboR 호환용 엔트리 4개를 추가했습니다.

#017A RDRES,  #017D WRRES

#0180 CHGCPU, #0183 GETCPU

VDP와 관련된 루틴(스크린10,11,12 및 수평 스크롤)을 제외하면 turboR처럼 사용가능합니다.


X-II모드에 내장된 디스크롬도 GT모드와 동일한 DOS2 v2.31 롬이 들어있어서,

부팅 환경에 따라 자동으로 고속모드/일반모드로 전환됩니다.

COMMAND2 2.44의 CPU 명령도 그대로 쓸 수 있습니다.

아무래도 별도의 유틸을 쓰는 것 보다는 turboR 호환모드로 두는 방식이 쓰기 편할 것 같습니다.

표준에서는 좀 벗어나지만, 대충 넘어가는 걸로...ㅋ


그럼, 외부 슬롯 이야기로 갑니다요~


SLT-Turbo의 외부 커넥터에는 SLT-X V2를 연결합니다.

8개의 서브슬롯이 SLOT 1-x, SLOT 2-x로 동작합니다.

SLT-X가 연결된 상태에서는 파란색 LED가 켜지는 것으로 확인가능합니다.

바이패스 커넥터에 연결하면 LED가 켜지지 않으니 참고하시구요.




위의 사진에서는 데모를 위해 WSX의 상단 슬롯에 꽂아놨지만,

실사용할 때는 대부분 후면 슬롯에서 사용하실 거라고 봅니다. 미디 케이블도 연결하구요.

이 상태에서 상단 슬롯에 PAC-V만 추가하면 해피 엔딩이 되겠죠 ㅎ.ㅎ


외부 슬롯의 CLOCK핀은 3.58MHz 출력으로 기존 turboR과 똑같습니다.

신호를 제대로 구현하려면 3.58MHz phase에 맞춰서 내부 클럭 폭을 늘려야겠지만,

일단 단순하게 wait로 때우는 식으로 만들어봅니다.

일부 타이밍에 민감한 기기 외에는 대충(ㅋ) 동작하겠습니다.


저의 기기들을 동작시키는 모습과 turboR 전용 프로그램을 실행하는 모습을 영상으로 담았습니다.

본체는 MSX2+ 기종(A1WSX)을 사용했구요. 영상 전반은 GT모드, 후반은 X-II모드로 돌렸습니다.

현재 보드는 SLT-X 연결시 고속클럭에서 문제가 있어서, Z80 클럭을 15MHz로 낮춘 상태입니다.

실제 turboR보다 약간 느린편이니, 영상을 보실 때 참고하셔요.





그럼, 다음편에서 보아요~