ГЛАВА 15
------------------------------------------------------------
Дисковая память I: Организация
Цель: Рассмотреть основные форматы записей в памяти на
твердом диске (винчестере) и на дискете, включая оглавление
и таблицу распределения файлов.
ВВЕДЕНИЕ
------------------------------------------------------------
Диск является распростроненным средством для более или
менее долговременного хранения данных. Процессы обработки
данных на твердом диске (винчестре) аналогичны процессам для
гибких дисков (дискет), за исключением того, что возможно
потребуется обеспечить пути для доступа к многочисленным
подоглавлениям винчестера. Для обработки файлов полезно
ознакомиться с организацией дисковой памяти. Каждая cторона
стандартной 5 1/4 дюймовой дискеты содержит 40 концентричес
ких дорожек, пронумерованных от 00 до 39. На каждой дорожке
форматируется восемь или девять секторов по 512 байтов
каждый.
Дданные записываются на диск в виде файлов, аналогично
тому, как вы записываете ассемблерные программы. Хотя на
типы данных, которые можно хранить в файле, не существует
каких-либо ограничений, типичный пользовательский файл
содержит списки заказчиков, описи товаров и предложений или
списки имен и адресов. Каждая запись содержит информацию о
конкретном заказчике или описание товара. Внутри файла все
записи имеют одинаковую длину и формат. Запись может
содержать oдно или несколько полей. Файл заказчиков,
например, может состоять из записей, в которые входит номер
заказчика, имя заказчика и долговой баланс. Эти записи могут
быть расположены в порядке возрастания номеров заказчиков
следующим образом:
---T---T-----¬---T---T-----¬---T---T-----¬ ---T---T-----¬
¦№1¦имя¦суммদ№2¦имя¦суммদ№3¦имя¦сумма¦...¦№n¦имя¦сумма¦
L--+---+------L--+---+------L--+---+------ L--+---+------
Для программирования дисковых файлов следует в общих
чертах ознакомится только с концепцией и терминологией. Если
в данной главе размеры диска не указываются, то
предполагается диск 5 1/4" формата.
ЕМКОСТЬ ДИСКА
------------------------------------------------------------
Емкость гибких дисков:
Версия Число Число Число Всего
дорожек секторов байтов в на двух
на стороне на дорожке секторе сторонах
До DOS 2.0 40 8 512 327 680
DOS 2.0 и после 40 9 512 368 640
Высокая плотность 80 15 512 1 228 800
3 1/2" 80 9 512 737 280
Емкость твердых дисков:
Версия Число Число Число Всего
дорожек секторов байтов в на 4-х
на стороне на дорожке секторе сторонах
10 мегабайт 306 17 512 10 653 696
20 мегабайт 614 17 512 21.377.024
Указание стороны (головки), дорожки или сектора на диске
осуществляется по номеру. Для стороны и дорожки отсчет
ведется с 0, а для сектора - с 1.
ОГЛАВЛЕНИЕ ДИСКА (КАТАЛОГ)
------------------------------------------------------------
Для того, чтобы организовать хранение информации на
диске, операционная система DOS резервируют определенные
сектора для своих нужд. Организация данных на дискете или
на твердом диске существенно зависит от их емкости. Формати
рованная двухстороняя дискета с девятью сектороми на дорожке
содержит следующую системную информацию:
Сторона Дорожка Сектор
0 0 1 Запись начальной загрузки
0 0 2-3 Таблица распределения файлов (FAT)
0 0 4-7 Каталог
1 0 1-3 Каталог
1 0 4 ... Файлы данных
Область записей данных начинается с третьего сектора на
1-й стороне 0-й дорожки и продолжается до девятого сектора.
Следующие записи заносятся на 0-ю сторону 1-й доpожки, затем
на 1-ю сторону 1-й дорожки, затем на 0-ю сторону 2-й дорожки
и т.д. Такая особенность заполнения дисковой памяти на
противоположных дорожках снижает число перемещений головки
дисковода. Данный метод используется как для гибких, так и
для твердых дисков.
При использовании утилиты FORMAT /S для форматизации
дискеты, модули DOS IBMBIO.COM и IBMDOS.COM записывается в
первые сектора области данных.
Все файлы, даже меньшие 512 байт (или кратные 512),
начинаются на границе сектора. Для каждого файла DOS создает
на нулевой доpожке диска элемент оглавления. Каждый такой
элемент описывает имя, дату, размер и расположение файла на
диске. Элементы оглавления имеют следующий формат:
Байт Назначение
0-7 Имя файла, определяемое из программы, создавшей
данный файл. Первый байт может указывать на статус
файла: шест.00 обозначает, что данный файл не
используется, шест.E5 - файл удален, шест. 2E -
элемент подоглавления.
8-10 Тип файла
11 Атрибут файла, определяющий его тип:
шест.00 - обычный файл;
шест.01 - файл можно только читать;
шест.02 - "спрятанный" файл;
шест.04 - системный файл DOS;
шест.08 - метка тома;
шест.10 - подоглавление;
шест.20 - архивный файл (для твердого диска).
12-21 Зарезервировано для DOS.
22-23 Время дня, когда файл был создан или последний раз
изменялся, в следующим двоичном формате:
¦чччччммммммссссс¦
24-25 Дата создания или последнего изменения файла, сжатая
в два слова в следующем двоичном формате:
¦гггггггм¦мммддддд¦
где год начинается с 1980 и может принимать значения
от 0 до 119, месяц - от 1 до 12, а день - от 1 до 31.
26-27 Начальный кластер файла. Относительный номер
последних двух секторов каталога. Первый файл данных
(без COM-модулей DOS) начинается на относительном
кластере 002. Текущая сторона, дорожка и кластер
зависят от емкости диска.
28-31 Размер файла в байтах. При создании файла DOS
вычисляет и записывает размер файла в это поле.
Все поля в каталоге диска, превышающие один байт,
записываются в обратной последовательности байтов.
ТАБЛИЦА РАСПРЕДЕЛЕНИЯ ФАЙЛОВ
------------------------------------------------------------
Назначение таблицы распределения файлов (FAT - File
Allocation Table) - распределение дискового пространства для
файлов. Если вы создаете новый файл или изменяете
существующий, то DOS меняет элементы таблицы файлов в
соответствии с расположением файла на диске. Запись
начальной загрузки находится на секторе 1, далее на секторе
2 начинается FAT. FAT содержит элементы для каждого
кластера, длина элементов FAT зависит от устройства дисковой
памяти. Кластер для односторонних дискет представляет
собой один сектор, для двухсторонних дискет - смежную пару
секторов. Одно и то же число элементов в FAT определяет в
два pаза больше данных для двухсторонних дискет, чем для
одностронних.
Первые байты FAT определяют тип устройства:
FE Односторонняя на 8 секторов
FC Односторонняя на 9 секторов
FF Двухсторонняя на 8 секторов
FD Двухсторонняя на 9 секторов
F9 Повышенная емкость (1,2 мегабайта)
F8 Твердый диск
Второй и третий байты пока содержат FFFF. В следующей
таблице показана организация данных для нескольких типов
устройств (приведены начальные и конечные номера секторов).
Колонка "Кластер" представляет число секторов в кластере:
Устройство диска Запись FAT Каталог Кластер
нач.загр.
Односторонний, 8 секторов 1 2-3 4-7 1
Односторонний, 9 секторов 1 2-5 6-9 1
Двухсторонний, 8 секторов 1 2-3 4-10 2
Двухсторонний, 9 секторов 1 2-5 6-12 2
Повышенная емкость (1,2 М) 1 2-15 16-29 1
Твердый диск XT 1 2-17 18-49 8
Твердый диск AT 1 2-838 4-115 4
Начиная с четвертого байта, элементы FAT определяют
сектора. Каждый такой элемент имеет длину 12 битов. (В
версии DOS 3 и старше элементы FAT для твердого диска могут
иметь длину 16 битов). Два первых элемента FAT, известные
как относительные сектора 000 и 001, соответственно,
указывают на два последних сектора оглавления, определяя
его размер и формат. Первый файл данных начинается на
относительном секторе 002. Каждый элемент FAT состоит из
трех шест.цифр (12 битов), которые указывают на характер
использования конкретного сектора:
000 свободный кластер,
nnn относительный номер следующего кластера для файла,
FF7 неиспользуемый кластер (сбойная дорожка),
FFF последний кластер файла.
Предположим, например, что дискета содержит только один
файл с именем PAYROLL.ASM, занимающий относительные сектора
002, 003 и 004. Элемент оглавления для этого файла содержит
имя файла PAYROLL, тип - ASM, шест.00 для обычного файла,
дату создания, 002 - номер первого относительного сектора
файла и размер файла в битах. Таблица FAT в этом случае
может выглядеть следующим образом (кроме того, что в каждой
паре байты в обратной последовательности):
Элемент FAT: ¦FDF¦FFF¦003¦004¦FFF¦000¦000¦...¦000¦
Относительн.сектор: 0 1 2 3 4 5 6 ...конец
Первые два элемента FAT указывают расположение каталога
на относительных секторах 000 и 001. Для ввода
рассматриваемого файла в память, система выполняет следующие
действия:
1. DOS получает доступ к дискете и ищет в каталоге имя
PAYROLL и тип ASM.
2. Затем DOS определяет по каталогу положение первого
относительного сектора файла (002) и загружает содержи
мое этого сектора в буферную область в основной
памяти.
3. Номер второго сектора DOS получает из элемента FAT,
соответствующего относительному сектору 002. Из
диаграммы, приведенной выше, видно, что зтот элемент
содержит 003. Это обозначает, что файл продолжается в
относительном секторе 003. DOS загружает содержимое
этого сектора в буфер в основной памяти.
4. Номер третьего сектора DOS получает из элемента FAT,
соответствующего относительному сектору 003. Этот
элемент содержит 004, значит файл продолжается в
относительном секторе 004. DOS загружает срдержимое
этого сектора в буфер в основной памяти.
5. Элемент FAT для относительного сектора 004 содержит
шест.FFF, что свидетельствует о том, что больше нет
данных для этого файла.
Элемент каталога содержит номер начального кластера для
каждого файла, а FAT - шест.трехзначные элементы, указываю
щие на расположение каждого дополнительного кластера, если
он имеется. Для того, чтобы указать, например, что файл
содержит все записи только в первом кластере, таблица FAT
должна содержать шест.FFF в элементе, представляющем первый
относительный кластер.
В качестве простого примера рассмотрим элемент каталога,
указывающий, что некоторый файл начинается в относительном
кластере 15. Для локализации первого элемента таблицы FAT
необходимо:
- Умножить 15 на 1,5, получим 22,5.
- Выполнить выборку содержимого байтов 22 и 23 из FAT.
Прежположим, что они содержат F*FF.
- Переставить байты: FFF*.
- Так как номер 15-нечетный, то первые три цифры - FFF
указывают на отсутствие других кластеров для данного
файла.
Теперь рассмотрим файл, который занимает четыре кластера,
начинающихся с номера 15. Таблица FAT, начиная с байта 22 и
далее, в этот pаз показана в правильной обратной
последовательности байтов в паpах:
6* 01 17 80 01 FF*F
Для того, чтобы найти первый элемент FAT, необходимо
умножить 15 на 1,5, получим 22,5, и выбрать содержимое
байтов 22 и 23, как в предыдущем примере. В этот раз эти
байты содержат 6*01, что после перестановки байт даст 016*.
Так как 15-число нечетное, то используются первые три цифры
016. Второй кластер для файла, следовательно, имеет номер
016.
Для того, чтобы найти третий кластер, необходимо умножить
16 на 1,5 получим 24. Затем следует выбрать содержимое
байтов 24 и 25 таблицы FAT. Значение 1780 после перестановки
байтов даст 8017. Так как число 16 четное, то используются
последние три цифры 017. Третий кластер для файла имеет
номер 017.
Для того, чтобы найти четвертый кластер, необходимо
умножить 17 на 1,5, получим 25.5. Затем следует выбрать
содержимое байтов 25 и 26 таблицы FAT. Значение 8001 после
перестановки байтов даст 0180. Так как число 17 нечетное, то
используются первые три цифры 018. Четвертый кластер для
файла имеет номер 018.
При использовании этой же процедуры для локализации
содержимого следующего элемента FAT по относительным адресам
27 и 28, получим FF*F, что после перестановки даст *FFF. Так
как число 18 четное, используются последние три цифры FFF,
что обозначает последний элемент.
Как было ранее сказано, все файлы начинаются на границе
кластеpа. Кроме того, совсем не обязательно файл должен
храниться в соседних кластерах, он может быть разбросан на
диске по разным секторам.
Если в программе необходимо определить тип установленного
диска, то можно обратиться к таблице FAT непосредственно,
или, что предпочтительней, использовать функцию DOS 1BH или
1CH.
ОСНОВНЫЕ ПОЛОЖЕНИЯ НА ПАМЯТЬ
------------------------------------------------------------
- Независимо от размеров все файлы начинаются на границе
кластера.
- Оглавление (каталог) содержит для каждого файл на диске
элементы, определяющие имя, тип, атрибуты, дату, началь
ный сектор и pазмер файла.
- Таблица распределения файлов (FAT) содержит один
элемент для каждого кластеpа в каждом файле.
ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ
------------------------------------------------------------
15.1. Какую длину в байтах имеет стандартный сектор?
15.2. Где расположена запись начальной загрузки?
15.3. Как обозначаются в оглавлении удаленные файлы?
15.4. Какие дополнительные действия выполняются при формати
зации дискеты по команде DOS FORMAT /S?
15.5. Где и каким образом обозначается в таблице FAT, что
устройством является твердый диск?
15.6. Имеется файл размером 2890 (десятичное) байтов: а) Где
хранит cистема размер файла? б) Как выражается этот
размер в шестнадцатиричном формате? в) Покажите значе
ние в том виде, как оно записывается системой.