Зачем компьютеру нужна файловая система – основные типы. Файловые системы. Структура файловой системы Характеристика и назначение файловой системы

12.11.2020

ВВЕДЕНИЕ

В настоящее время наиболее распространенными являются персональные компьютеры (ПК) на базе процессора Pentium. На большинстве этих ПК устанавливается операционная система (ОС) Windows 95 или Windows 98 (Windows 9x или просто Windows). Windows является фактически стандартом для 32-разрядных персональных компьютеров. К настоящему времени разработано уже несколько версий системы.

Операционная система (ОС)- это комплекс программ, обеспечивающих управление аппаратурой ЭВМ, планирование эффективного использования ее ресурсов и решение задач по заданиям пользователей. ОС загружается в компьютер при его включении.

Отличительными чертами современных операционных систем, в том числе Windows 9x, являются:

Развитый пользовательский интерфейс, то есть средства и методы взаимодействия с пользователем;

Многозадачность – способность обеспечивать выполнение нескольких программ «одновременно»;

Использование всех возможностей, предоставляемых современными микропроцессорами;

Устойчивость в работе и защищенность.

Windows 9x является преемницей и результатом слияния двух систем Windows 3.1x и MS-DOS. Разработчикам пришлось принять ряд компромиссов для обеспечения ее совместимости с названными системами:

Windows 9x начинает функционирование в реальном режиме, и лишь затем переходит в защищенный режим;

В основе Windows 9x лежит обновленная MS-DOS;

В Windows 9x имеется достаточное количество 16 – разрядных компонентов (модулей и драйверов устройств).

В основе ОС Windows 9x лежит объектно-ориентированный подход. Объектами являются документы, приложения, папки, файлы, ярлыки, диски и т. д. Открытие объекта –одно из основных понятий в системе. Выполняемые при этом действия зависят от разновидности объекта:

- открытие документа заключается в запуске подходящего приложения и загрузке документа в это приложение, чтобы обеспечить возможность его просмотра, редактирования и печати. Вместо открытия и загрузки документа можно говорить об открытии и загрузке файла с документом, поскольку все документы хранятся в файлах;

- открытие приложения - запуск его в работу;

- открытие папки состоит в отображении на экране ее содержимого, что позволяет осуществить любые действия с находящимися в ней объектами;

- открытие устройства ввода – вывода позволяет попасть в среду диспетчера, обеспечивающего управление этим устройством;

- открытие ярлыка во многих случаях равносильно открытию того объекта, для которого он создан.

При обработке документа можно использовать как процедурный, так и объектно-ориентированный подход. В первом случае необходимо знать, каким приложением следует обрабатывать документ. В другом случае при двойном щелчке на документе или созданном для него ярлыке запускается проассоциированное с ним приложение. Если Windows «не знает», какое приложение должно обрабатывать данный документ, предложит связать документ с определенным приложением.

КОМПОНЕНТЫ ФАЙЛОВОЙ СИСТЕМЫ

Работа на ПК происходит с различного рода данными. Под данными понимается все, что подлежит хранению (программы в исходном или машинном коде, данные для ее работы, любые текстовые документы и числовые данные, закодированная табличная, графическая и другая информация).

Файл - это поименованная совокупность однородной информации на внешнем носителе (например, на магнитном диске).

В имени файла (ОС Windows 9x) могут использоваться почти все печатаемые символы, но имеется ряд ограничений:

В начале и в конце имени файла не может быть пробелов (их можно задать, но они будут игнорироваться);

Имя файла не может начинаться с точки и ею заканчиваться;

В имени файла нельзя применять следующие символы: /, \, :, ?, ’’, <, >, |, так как они зарезервированы для других целей;

Длина имени файла не должна превышать (в общем случае) 255 символов.

Такие имена называются длинными. Например, Лабораторная работа №1 по дисциплине операционные системы.

Для каждого файла Windows 9x автоматически генерирует короткое имя, которое формируется, исходя из требований ОС MS-DOS, и используется для обеспечения совместимости операционных систем. Оно содержит не более 8 символов. Кроме символов, запрещенных в длинных именах, не допускается использовать символы;, +, [, ], =, «точка», «запятая», «пробел». Короткое имя начинается, как и длинное, далее следует символ ~ и порядковый номер (всего не более 8 символов). При этом запрещенные символы опускаются, строчные буквы перекодируются в прописные. Например, PRIMER~1 может соответствовать длинному имени файла, начинающемуся буквами Primer. Если есть еще такой файл, то его короткое имя будет PRIMER~2.

Запрещенными являются имена, зарезервированные для устройств ввода-вывода: PRN (принтер), CON (консоль, т.е. клавиатура и монитор), NUL (фиктивное устройство), LPT1 –LPT3 (первый – третий параллельный порт), COM1 – COM3 (первый – третий последовательный порт). Символами латинского алфавита A:, B:, C:, D: и т.д. именуются внешние запоминающие устройства.

Если в имени файла присутствует хоть одна точка, то считается, что оно снабжено расширением, в соответствии с характером хранимой информации. Расширением имени файла является последовательность символов, находящаяся после последней заданной в имени точки. Точка рассматривается как разделитель имени и расширения. Задание расширения осуществляет либо сам пользователь, либо программа, порождающая файл. Лучше использовать стандартные 1 – 3х символьные расширения, так как становится понятным тип файла, например:

ВАТ для командных файлов;

DOC для файлов, содержащих различные документы в формате редактора Microsoft Word;

PAS для программ, написанных на языке PASCAL; -

PCX для файлов с иллюстрацией в формате растрового графического редактора Publishers Paintbrush;

ВАК для файлов с предыдущей версией документа (резервные файлы);

ЕХЕ для файлов, с готовой к выполнению программой

СОМ для файлов, с готовой к выполнению программой только в среде MS-DOS.

В настоящее время для программ, готовых к выполнению под управлением операционной системы, используют термин приложение (application), например, Windows - приложение

Пример файла: COMMAND.COM, COMMAND - имя файла, СОМ – расширение.

Кроме длинного и короткого имен с каждым файлом связывается ряд свойств. К числу свойств файлов относятся:

Атрибуты файла;

Дата и время его создания;

Дата и время модификации файла;

Дата последнего доступа к файлу (по чтению или записи);

Длина, или размер файла (в байтах).

Атрибуты файла определяют способы его использования и права доступа к нему. В Windows 9x атрибуты играют скорее информационную роль, чем защитную, как в среде MS-DOS. Файлу может быть приписана любая комбинация из перечисленных ниже атрибутов:

Read-Only [R] (Только чтение) - устанавливает защиту файла от записи, файл не может быть удален, перемещен или изменен без специальных мер;

Archive [A] (Архивный) - устанавливает для файла архивный статус, устанавливается автоматически при создании или модификации файла, снимается средствами архивирования или резервирования;

Hidden [H] (Скрытый) – скрытые файлы, если не предпринять специальных мер, в папках не показываются.

System [S] (Системный) – атрибут, которым снабжаются системные файлы.

С каждым файлом в среде Windows 9x связывается пиктограмма, которая соответствует типу файла. Пиктограмма – это маленькая иллюстрация, помогающая быстро идентифицировать объект, с которым она связана.

Часто для обозначения сразу нескольких файлов или для сокращения записи имен файлов используется шаблон имени файла. Шаблоном имени является имя, в котором употребляются символы - заменители "*" и "?". Позиция, в которой стоит знак "?" , может содержать любой символ. "*" означает,что ту позицию,в которой стоит "*", и все последующие могут занимать любые символы.

*.ТХТ - все файлы типа ТХТ;

А?.* - все файлы, имена которых начинаются с буквы А и состоят из одной или двух букв.

1.2. Папки (каталоги)

По мере роста задач число файлов на диске сильно возрастает и, даже при умело подобранных именах файлов, становится сложно следить за порядком на диске и ориентироваться в файлах. Группа файлов на одном носителе, объединяемых по какому-либо критерию, может храниться в папке (folders). В MS-DOS использовалось понятие каталог или директорий (directory). Аналогия между папками и каталогами не является полной. Каждый каталог можно считать папкой, но не каждой папке соответствует каталог на диске, а если и соответствует, то он может находиться в совершенно ином месте файловой структуры. Если в папке (каталоге) хранится имя файла, то говорят, что этот файл находится в данном каталоге. Каждая папка в Windows 9x имеет пиктограмму и имя также как и файл (но, как правило, без расширения).

(Любая) папка может быть зарегистрирована в другой папке. Поэтому файловая структура на дисках является иерархической многоуровневой или древовидной, в корне которой находится главная папка , или корневой каталог (ROOT DIRECTORY) На каждом диске имеется одна такая папка, которая обозначается символом " \ ". Корневой каталог создается при форматировании диска и не может быть ни переименован, ни удален. Следует заметить, что на гибких магнитных дисках папки создавать не принято.

Если одна папка непосредственно содержится в другой, то первая называется дочерней (подкаталог), а вторая – родительской (надкаталог) по отношению к первой папке. В MS-DOS для обозначения родительского каталога используется символ "..".

MS-DOS поддерживает концепцию текущего накопителя и текущих каталогов . Первоначально текущим является накопитель, с которого производилась загрузка системы, и соответственно каталог. Каталог, с которым в настоящий момент работает пользователь, называется текущим. Точно также определяется текущий накопитель. Текущий каталог текущего диска называется рабочим. Windows также поддерживает эту концепцию, но несколько иначе.Например, смена рабочей папки в приложениях происходит неявно – при открытии и сохранении документов.

Пример фрагмента файловой структуры на диске приведен на рис. 1.

Рис. 1

На рис.1 каталог Documents зарегистрирован в каталоге My folder, поэтому говорят, что Documents - подкаталог My folder, а My folder - надкаталог, или родительский каталог, для Documents.

С каждой папкой (но не главной), аналогично, как и с файлом, связывается ряд свойств. У папок устанавливается атрибут Directory (D), который отличает ее от файла, а также ассоциируется дата и время создания.

При разветвленной структуре файлов на диске недостаточно для нахождения файла указать только его имя (если не пользоваться высокоуровневыми средствами Windows). Необходимо указание маршрута (пути) к файлу. Маршрут - это последовательность из имен каталогов, разделенных символом "\", которая указывает маршрут от корневого (полныймаршрут) или текущего каталога диска к тому, в котором находится нужный файл. Таким образом, полное имя файла , или спецификация файла имеет следующий вид:

[диск:][полный_маршрут\]имя.тип.

В квадратных кавычках обозначаются необязательные параметры.

Если в полном имени используются символы, недопустимые для коротких имен (в среде MS-DOS), спецификацию необходимо заключать в кавычки.

Пример полного имени файла: A:\PROGRAM\PASCAL\LAB.PAS.

Например, к файлу DEMO.EXE, находящемуся в подкаталоге PROGRAM, можно обращаться:

DEMO.EXE, если текущим является каталог PROGRAM;

PROGRAM\DEMO.EXE, если текущий каталог корневой;

-..\demo.exe, если текущий каталог PASCAL.

1.3. Ярлыки

Средствами Windows 9x обеспечивается на дисках создание еще одного компонента файловой системы – ярлыков. Ярлык (shortcut) представляет собой файл, содержащий указатель (ссылку) на некоторый объект в дереве ресурсов – другой файл, папку или периферийное устройство. (Файловые структуры всех доступных дисков, а также некоторые устройства ввода – вывода объединяются в дерево ресурсов .) Одному объекту может соответствовать несколько ярлыков, находящихся в разных папках. При удалении ярлыка уничтожается только ссылка на объект, который при этом никак не изменяется. При двойном щелчке на ярлыке документа будет неявно запущено приложение, которое связано с этим документом, а сам документ загружен в него для обработки. Чаще всего ярлыки размещают на рабочем столе, чтобы облегчить доступ к постоянно используемым объектам. Именуется ярлык по тем же правилам, что и файл, но ему приписывается стандартное расширение LNK (от LiNK –связь). Пиктограмма ярлыка совпадает с пиктограммой объекта, для которого ярлык создан, но имеет загнутую стрелку в левом нижнем углу.

Если ярлык создается для приложения MS-DOS или командного файла, то вместо ярлыка формируется файл с расширением PIF. Этот файл в среде Windows 95 может рассматриваться как ярлык специального вида, ссылающийся на исполняемый файл для среды MS-DOS.

1.4. Рабочий стол

После загрузки системы Windows 9x на экране монитора показывается Рабочий стол (Desktop), (как считается) самая большая папка. Рабочий стол и сам является объектом системы, но в отличие от объектов, находящихся на нем, он не может быть перенесен или скопирован ни в один из них. На рабочем столе допускаются размещать любые объекты из дерева ресурсов, обычно на нем находятся только стандартные (системные) папки и ярлыки для тех объектов, доступ к которым осуществляется наиболее часто.

Стандартная (системная) папка – это папка, создаваемая и обслуживаемая самой Windows. Приведем некоторые из стандартных папок, размещенных на рабочем столе:

Папка Мой компьютер (My computer) – является образом компьютера и позволяет получить доступ к его ресурсам. Получив доступ к некоторому объекту, можно выполнить с ним требуемые операции или изменить его свойства;

Папка Корзина (Recycle Bin). В эту папку попадают удаляемые файлы и ярлыки, чтобы имелась возможность их при необходимости восстановить. Размер корзины регулируется.

Эти две папки являются обязательными, остальные – нет. Особенностями стандартных папок является (в большинстве) случаев невозможность их удалить, переименовать, обладание особыми свойствами, наличие специфических команд в контекстных меню. С точки зрения Windows рабочий стол – тоже стандартная (системная) папка.

Контрольные вопросы:

1. Что такое файл, имя и расширение файла, шаблон?

2. Какие файлы называются исполняемыми?

3. Что такое папка (каталог), подкаталог, корневой и родительский каталог?

4. Какие папки являются стандартными?

5. Дать определение спецификации, или полного имени файла.

6. Что такое ярлык?

КОМАНДЫ MS-DOS

Запуск команд производится из командной строки после получения приглашения к работе или из командного файла. Приглашение выдается, когда ОС готова к работе.

Формат команд MS-DOS:

команда [параметры] .

Параметры от команды отделяются пробелами. Если пользователь не включает никаких параметров и ключей в команды, система предусматривает их значения по умолчанию. Ключ /? Выдает справку по команде. Прервать выполнение команды или программы можно нажатием клавиш ; приостановить вывод информации на экран - , продолжить - нажатием любой клавиши.

Существуют два типа команд MS-DOS: встроенные (внутренние) и загружаемые (внешние). Встроенные команды - простейшие, наиболее часто употребляемые, являющиеся составной частью командного процессора сommand.com и в каталоге не отображаются. (Например, DIR, COPY, DEL и другие.) К загружаемым командам относятся остальные команды, постоянно хранящиеся в файлах на диске (например, FORMAT).Прежде чем запустить на выполнение эти команды, необходимо убедиться в их наличии на диске. Рассмотрим некоторые команды MS-DOS.

3.1 Для смены текущего дисковода надо набрать имя дисковода, который должен стать текущим, затем символ ":" .

Например,

команда осуществляет переход с диска A: на диск С:.

3.2 Изменение текущего каталога

CD (CHDIR) [дисковод:] путь

Например,

CD PROGRAM - переход в подкаталог PROGRAM;

CD.. - переход в родительский каталог.

3.3 Вывод файла на экран.

TYPE [дисковод:][маршрут\]имя.тип.

Например,

TYPE \PROGRAM\PASCAL\lab.txt ;

TYPE AUTOEXEC.BAT .

2.4 Удаление файла или группы файлов

DEL [дисковод:][маршрут\]имя.тип.

В этой команде допускается использование шаблона.

Например,

DEL*.* - удаление всех файлов текущего каталога.

2.5 Просмотр каталога

DIR [дисковод:][маршрут\][имя.тип] .

Для каждого файла команда сообщает его имя, тип, размер файла в байтах, дату создания и время создания или последнего обновления файла. В конце сообщается о размере свободного пространства. Ключ ""/P "" останавливает ввод содержимого каталога по мере заполнения экрана, для продолжения ввода нажать любую клавишу. При использовании ключа " /W " на экран выводятся только имена файлов (и расширения) по 5 в строку.

2.6 Создание подкаталога

MD (MKDIR) [дисковод:] путь

2.7 Удаление подкаталога

RD (RMDIR) [дисковод:] путь

Этой командой может быть удален любой подкаталог, но при этом он не должен содержать ни файлов, ни других подкаталогов (для предотвращения потери файлов из-за случайного стирания). Естественно не могут быть уничтожены текущий подкаталог и главный каталог.

2.8 Переименование файлов

REN[диск:][ маршрут\]старое_имя новое_имя.

Эта команда позволяет изменить имя соответствующего файла без изменения его содержимого. Команда допускает использование шаблона.

2.9 Очистка экрана

2.10 Вывод версии операционной системы

При вводе этой команды на экране появляется номер версии операционной системы, который зависит от года создания версии. Знание версии необходимо, так как средства год от года наращиваются и команды и программы, написанные для более поздних версий, не будут работать вообще или выполняться по-другому.

2.11 Установка текущего времени

TIME [чч:mm:cc:дд]

Этой командой устанавливается текущее время при загрузке MS-DOS или в любой другой момент работы на машине. При запуске команды без параметров выдается текущее время и запрашивается новое, нажав на клавишу , можно согласиться с текущим временем.

2.12 Установка текущей даты

DATE [мм:дд:гг]

Команда устанавливает текущую дату аналогично команде TIME по установлению текущего времени.

2.13 Просмотр дерева подкаталогов

По этой команде на экран дисплея выводится логический список всех подкаталогов на активном диске. При добавлении ключа F можно получить и список файлов, содержащихся в этих подкаталогах.

2.14 Копирование отдельных файлов

Команда COPY позволяет копировать файлы с диска на диск, осуществлять обмен данными между периферийными устройствами и объединять данные в процессе копирования.

COPY [диск:][маршрут\]исф[диск:][ маршрут \][инф] ,

где исф - имя старого файла с расширением, инф - имя нового файла с расширением. Ключ /V позволяет производить копирование с проверкой правильности копирования. В этой команде допускается использование шаблона.

При использовании команды COPY для обмена информацией между периферийными устройствами вместо имен файлов подставляют в команду специальные имена CON, PRN, NIL и др., которые имеют следующие значения:

CON - консоль: клавиатура для ввода данных, видеодисплей для вывода результатов и контроля диалога;

PRN -основной принтер, связанный с вашей системой;

NUL -псевдоустройство (несуществующее) для тестирования программ.

Команда COPY позволяет объединить несколько файлов в один знаком "+". При таком объединении (конкатенации) исходные файлы не меняются, а в новый файл будут записаны текущее время и дата.

1) COPY PASCAL\*.PAS B: ,

происходит копирование всех файлов с типом PAS из подкаталога PASCAL на диск В:

2) COPY FILE.EXT PRN ,

вывод файла FILE.EXT на печать.

3) COPY CON FILE.EXT ,

ввод данных с клавиатуры в файл FILE.EXT, при этом конец файла порождает комбинация клавиш (создание файла в MS-DOS).

4) COPY FILE1.EXT+FILE2.EXT+FILE3.EXT BOOK.EXT ,

объединение нескольких файлов в один BOOK.EXT.

2.15 Защита файлов от записи

ATTRIB [+R ¦ -R] [+A ¦-A] [ диск:][маршрут\]имя_файла.

R - устанавливает защиту файла от записи;

R - отменяет защиту файла от записи;

A - устанавливает для файла архивный статус;

A - отменяет для файла архивный статус;

ATTRIB +R FILE.EXT - нельзя записывать информацию в этот файл;

ATTRIB FILE.EXT -делается запрос о возможности записи данных в FILE.EXT. Ответ операционной системы:

R_A:\FILE.EXT , т.е. файл недоступен для записи.

2.16. Переадресация данных:

> - переадресовать выходные данные. Данные, которые всегда выводятся на экран, перенаправляются на периферийное устройство или дисковый файл. В последнем случае файл при необходимости создаётся. Если файл существует, то старые данные замещаются на новые.

TYPE FILE.TXT > PRN

ECHO Завтра собрание группы > PRN

>> - выходные данные также перенаправляются, но если файл уже существует, то данные добавляются к старым данным.

< - переадресовать входные данные. Данные будут приниматься не с клавиатуры, а с периферийного устройства или из дискового файла.

PROGRAM < FILE.TXT

Замечание: Программа, результаты выполнения которой мы хотим переадресовать, должна использовать стандартные функции ввода/вывода.

2.17. Организация конвейеров.

Можно выстроить команды или программы в цепочку так, что вывод на экран первой из них будет использован как ввод с клавиатуры для следующей A1|A2|A3.

ECHO Y | DEL *.* >NUL – автоматически ответит Y (Да) на запрос «Вы уверены…» при удалении всех элементов каталога.

Происходит по (конвейеру) | передача данных из одной программы в другую. Гораздо эффективнее использование | (конвейера) с командами фильтрами и переадресации.

2.18.Фильтры FIND, MORE, SORT.

а) Поиск указанных данных в дисковом файле (номер телефона, адрес, любая фраза):

FIND “фраза” [путь\] имя файла,

где /C – счётчик обнаружения, т.е. сколько раз обнаружена фраза, а сами строки не выводятся;

/N – выводится ещё и номер строки (кроме самой строки);

/V – выводятся все строки, не содержащие данную фразу.

FIND “группа” FILE.TXT – выводится строка из файла, содержащая слово “группа”.

DIR | FIND /V “COM” – выводятся на экран все файлы, кроме файлов с расширением COM.

FIND “car” AB.DAT, B.DAT, C.DAT – расходы на автомобиль.

б) Постраничный вывод на экран

MORE < FILE.TXT

TYPE FILE.EXT | MORE

в) Сортировка данных.

SORT (по умолчанию сортировка по 1 символу по алфавиту в порядке возрастания),

где /R - сортировка по убыванию;

/+n – начиная с колонки n, в строке будет происходить сортировка.

ввод информации с клавиатуры, Ù Z – признак конца вводимой информации.

Это желательно записать в файл, т.е. SORT < CON > FILE.TXT.

DIR | SORT – отсортированы элементы каталога по именам файлов (каталогов).

DIR | SORT /+10 > FILE.EXT -

список файлов будет упорядочен по расширениям (WINDOWS 9X).

Почему смартфон может не запускать программы с карты памяти? Чем ext4 принципиально отличается от ext3? Почему флешка проживет дольше, если отформатировать ее в NTFS, а не в FAT? В чем главная проблема F2FS? Ответы кроются в особенностях строения файловых систем. О них мы и поговорим.

Введение

Файловые системы определяют способ хранения данных. От них зависит, с какими ограничениями столкнется пользователь, насколько быстрыми будут операции чтения и записи и как долго накопитель проработает без сбоев. Особенно это касается бюджетных SSD и их младших братьев - флешек. Зная эти особенности, можно выжать из любой системы максимум и оптимизировать ее использование для конкретных задач.

Выбирать тип и параметры файловой системы приходится всякий раз, когда надо сделать что-то нетривиальное. Например, требуется ускорить наиболее частые файловые операции. На уровне файловой системы этого можно достичь разными способами: индексирование обеспечит быстрый поиск, а предварительное резервирование свободных блоков позволит упростить перезапись часто изменяющихся файлов. Предварительная оптимизация данных в оперативной памяти снизит количество требуемых операций ввода-вывода.

Увеличить срок безотказной эксплуатации помогают такие свойства современных файловых систем, как отложенная запись, дедупликация и другие продвинутые алгоритмы. Особенно актуальны они для дешевых SSD с чипами памяти TLC, флешек и карт памяти.

Отдельные оптимизации существуют для дисковых массивов разных уровней: например, файловая система может поддерживать упрощенное зеркалирование тома, мгновенное создание снимков или динамическое масштабирование без отключения тома.

Черный ящик

Пользователи в основном работают с той файловой системой, которая предлагается по умолчанию операционной системой. Они редко создают новые дисковые разделы и еще реже задумываются об их настройках - просто используют рекомендованные параметры или вообще покупают предварительно отформатированные носители.

У поклонников Windows все просто: NTFS на всех дисковых разделах и FAT32 (или та же NTFS) на флешках. Если же стоит NAS и в нем используется какая-то другая файловая система, то для большинства это остается за гранью восприятия. К нему просто подключаются по сети и качают файлы, как из черного ящика.

На мобильных гаджетах с Android чаще всего встречается ext4 во внутренней памяти и FAT32 на карточках microSD. Яблочникам же и вовсе без разницы, что у них за файловая система: HFS+, HFSX, APFS, WTFS... для них существуют только красивые значки папок и файлов, нарисованные лучшими дизайнерами. Богаче всего выбор у линуксоидов, но прикрутить поддержку неродных для операционки файловых систем можно и в Windows, и в macOS - об этом чуть позже.

Общие корни

Различных файловых систем создано свыше сотни, но актуальными можно назвать чуть больше десятка. Хотя все они разрабатывались для своих специфических применений, многие в итоге оказались родственными на концептуальном уровне. Они похожи, поскольку используют однотипную структуру представления (мета)данных - B-деревья («би-деревья»).

Как и любая иерархическая система, B-дерево начинается с корневой записи и далее ветвится вплоть до конечных элементов - отдельных записей о файлах и их атрибутах, или «листьев». Основной смысл создания такой логической структуры был в том, чтобы ускорить поиск объектов файловой системы на больших динамических массивах - вроде жестких дисков объемом в несколько терабайт или еще более внушительных RAID-массивов.

B-деревья требуют гораздо меньше обращений к диску, чем другие типы сбалансированных деревьев, при выполнении тех же операций. Достигается это за счет того, что конечные объекты в B-деревьях иерархически расположены на одной высоте, а скорость всех операций как раз пропорциональна высоте дерева.

Как и другие сбалансированные деревья, B-trees имеют одинаковую длину путей от корня до любого листа. Вместо роста ввысь они сильнее ветвятся и больше растут в ширину: все точки ветвления у B-дерева хранят множество ссылок на дочерние объекты, благодаря чему их легко отыскать за меньшее число обращений. Большое число указателей снижает количество самых длительных дисковых операций - позиционирования головок при чтении произвольных блоков.

Концепция B-деревьев была сформулирована еще в семидесятых годах и с тех пор подвергалась различным улучшениям. В том или ином виде она реализована в NTFS, BFS, XFS, JFS, ReiserFS и множестве СУБД. Все они - родственники с точки зрения базовых принципов организации данных. Отличия касаются деталей, зачастую довольно важных. Недостаток у родственных файловых систем тоже общий: все они создавались для работы именно с дисками еще до появления SSD.

Флеш-память как двигатель прогресса

Твердотельные накопители постепенно вытесняют дисковые, но пока вынуждены использовать чуждые им файловые системы, переданные по наследству. Они построены на массивах флеш-памяти, принципы работы которой отличаются от таковых у дисковых устройств. В частности, флеш-память должна стираться перед записью, а эта операция в чипах NAND не может выполняться на уровне отдельных ячеек. Она возможна только для крупных блоков целиком.

Связано это ограничение с тем, что в NAND-памяти все ячейки объединены в блоки, каждый из которых имеет только одно общее подключение к управляющей шине. Не будем вдаваться в детали страничной организации и расписывать полную иерархию. Важен сам принцип групповых операций с ячейками и тот факт, что размеры блоков флеш-памяти обычно больше, чем блоки, адресуемые в любой файловой системе. Поэтому все адреса и команды для накопителей с NAND flash надо транслировать через слой абстрагирования FTL (Flash Translation Layer).

Совместимость с логикой дисковых устройств и поддержку команд их нативных интерфейсов обеспечивают контроллеры флеш-памяти. Обычно FTL реализуется именно в их прошивке, но может (частично) выполняться и на хосте - например, компания Plextor пишет для своих SSD драйверы, ускоряющие запись.

Совсем без FTL не обойтись, поскольку даже запись одного бита в конкретную ячейку приводит к запуску целой серии операций: контроллер отыскивает блок, содержащий нужную ячейку; блок считывается полностью, записывается в кеш или на свободное место, затем стирается целиком, после чего перезаписывается обратно уже с необходимыми изменениями.

Такой подход напоминает армейские будни: чтобы отдать приказ одному солдату, сержант делает общее построение, вызывает бедолагу из строя и командует остальным разойтись. В редкой ныне NOR-памяти организация была спецназовская: каждая ячейка управлялась независимо (у каждого транзистора был индивидуальный контакт).

Задач у контроллеров все прибавляется, поскольку с каждым поколением флеш-памяти техпроцесс ее изготовления уменьшается ради повышения плотности и удешевления стоимости хранения данных. Вместе с технологическими нормами уменьшается и расчетный срок эксплуатации чипов.

Модули с одноуровневыми ячейками SLC имели заявленный ресурс в 100 тысяч циклов перезаписи и даже больше. Многие из них до сих пор работают в старых флешках и карточках CF. У MLC корпоративного класса (eMLC) ресурс заявлялся в пределах от 10 до 20 тысяч, в то время как у обычной MLC потребительского уровня он оценивается в 3–5 тысяч. Память этого типа активно теснит еще более дешевая TLC, у которой ресурс едва дотягивает до тысячи циклов. Удерживать срок жизни флеш-памяти на приемлемом уровне приходится за счет программных ухищрений, и новые файловые системы становятся одним из них.

Изначально производители предполагали, что файловая система неважна. Контроллер сам должен обслуживать недолговечный массив ячеек памяти любого типа, распределяя между ними нагрузку оптимальным образом. Для драйвера файловой системы он имитирует обычный диск, а сам выполняет низкоуровневые оптимизации при любом обращении. Однако на практике оптимизация у разных устройств разнится от волшебной до фиктивной.

В корпоративных SSD встроенный контроллер - это маленький компьютер. У него есть огромный буфер памяти (полгига и больше), и он поддерживает множество методов повышения эффективности работы с данными, что позволяет избегать лишних циклов перезаписи. Чип упорядочивает все блоки в кеше, выполняет отложенную запись, производит дедупликацию на лету, резервирует одни блоки и очищает в фоне другие. Все это волшебство происходит абсолютно незаметно для ОС, программ и пользователя. С таким SSD действительно непринципиально, какая файловая система используется. Внутренние оптимизации оказывают гораздо большее влияние на производительность и ресурс, чем внешние.

В бюджетные SSD (и тем более - флешки) ставят куда менее умные контроллеры. Кеш в них урезан или отсутствует, а продвинутые серверные технологии не применяются вовсе. В картах памяти контроллеры настолько примитивные, что часто утверждается, будто их нет вовсе. Поэтому для дешевых устройств с флеш-памятью остаются актуальными внешние методы балансировки нагрузки - в первую очередь при помощи специализированных файловых систем.

От JFFS к F2FS

Одной из первых попыток написать файловую систему, которая бы учитывала принципы организации флеш-памяти, была JFFS - Journaling Flash File System. Изначально эта разработка шведской фирмы Axis Communications была ориентирована на повышение эффективности памяти сетевых устройств, которые Axis выпускала в девяностых. Первая версия JFFS поддерживала только NOR-память, но уже во второй версии подружилась с NAND.

Сейчас JFFS2 имеет ограниченное применение. В основном она все так же используется в дистрибутивах Linux для встраиваемых систем. Ее можно найти в маршрутизаторах, IP-камерах, NAS и прочих завсегдатаях интернета вещей. В общем, везде, где требуется небольшой объем надежной памяти.

Дальнейшей попыткой развития JFFS2 стала LogFS, у которой индексные дескрипторы хранились в отдельном файле. Авторы этой идеи - сотрудник немецкого подразделения IBM Йорн Энгель и преподаватель Оснабрюкского университета Роберт Мертенс. Исходный код LogFS выложен на GitHub . Судя по тому, что последнее изменение в нем было сделано четыре года назад, LogFS так и не обрела популярность.

Зато эти попытки подстегнули появление другой специализированной файловой системы - F2FS. Ее разработали в корпорации Samsung, на долю которой приходится немалая часть производимой в мире флеш-памяти. В Samsung делают чипы NAND Flash для собственных устройств и по заказу других компаний, а также разрабатывают SSD с принципиально новыми интерфейсами вместо унаследованных дисковых. Создание специализированной файловой системы с оптимизацией для флеш-памяти было с точки зрения Samsung давно назревшей необходимостью.

Четыре года назад, в 2012 году, в Samsung создали F2FS (Flash Friendly File System). Ее идея хороша, но реализация оказалась сыроватой. Ключевая задача при создании F2FS была проста: снизить число операций перезаписи ячеек и распределить нагрузку на них максимально равномерно. Для этого требуется выполнять операции с несколькими ячейками в пределах того же блока одновременно, а не насиловать их по одной. Значит, нужна не мгновенная перезапись имеющихся блоков по первому запросу ОС, а кеширование команд и данных, дозапись новых блоков на свободное место и отложенное стирание ячеек.

Сегодня поддержка F2FS уже официально реализована в Linux (а значит, и в Android), но особых преимуществ на практике она пока не дает. Основная особенность этой файловой системы (отложенная перезапись) привела к преждевременным выводам о ее эффективности. Старый трюк с кешированием даже одурачивал ранние версии бенчмарков, где F2FS демонстрировала мнимое преимущество не на несколько процентов (как ожидалось) и даже не в разы, а на порядки. Просто драйвер F2FS рапортовал о выполнении операции, которую контроллер только планировал сделать. Впрочем, если реальный прирост производительности у F2FS и невелик, то износ ячеек определенно будет меньше, чем при использовании той же ext4. Те оптимизации, которые не сможет сделать дешевый контроллер, будут выполнены на уровне самой файловой системы.

Экстенты и битовые карты

Пока F2FS воспринимается как экзотика для гиков. Даже в собственных смартфонах Samsung все еще применяется ext4. Многие считают ее дальнейшим развитием ext3, но это не совсем так. Речь идет скорее о революции, чем о преодолении барьера в 2 Тбайт на файл и простом увеличении других количественных показателей.

Когда компьютеры были большими, а файлы - маленькими, адресация не представляла сложностей. Каждому файлу выделялось энное количество блоков, адреса которых заносились в таблицу соответствия. Так работала и файловая система ext3, остающаяся в строю до сих пор. А вот в ext4 появился принципиально другой способ адресации - экстенты.

Экстенты можно представить как расширения индексных дескрипторов в виде обособленных наборов блоков, которые адресуются целиком как непрерывные последовательности. Один экстент может содержать целый файл среднего размера, а для крупных файлов достаточно выделить десяток-другой экстентов. Это куда эффективнее, чем адресовать сотни тысяч мелких блоков по четыре килобайта.

Поменялся в ext4 и сам механизм записи. Теперь распределение блоков происходит сразу за один запрос. И не заранее, а непосредственно перед записью данных на диск. Отложенное многоблочное распределение позволяет избавиться от лишних операций, которыми грешила ext3: в ней блоки для нового файла выделялись сразу, даже если он целиком умещался в кеше и планировался к удалению как временный.

Диета с ограничением FAT

Помимо сбалансированных деревьев и их модификаций, есть и другие популярные логические структуры. Существуют файловые системы с принципиально другим типом организации - например, линейным. Как минимум одной из них ты наверняка часто пользуешься.

Загадка

Отгадай загадку: в двенадцать она начала полнеть, к шестнадцати была глуповатой толстушкой, а к тридцати двум стала жирной, так и оставшись простушкой. Кто она?

Правильно, это история про файловую систему FAT. Требования совместимости обеспечили ей дурную наследственность. На дискетах она была 12-разрядной, на жестких дисках - поначалу 16-битной, а до наших дней дошла уже как 32-разрядная. В каждой следующей версии увеличивалось число адресуемых блоков, но в самой сути ничего не менялось.

Популярная до сих пор файловая система FAT32 появилась аж двадцать лет назад. Сегодня она все так же примитивна и не поддерживает ни списки управления доступом, ни дисковые квоты, ни фоновое сжатие, ни другие современные технологии оптимизации работы с данными.

Зачем же FAT32 нужна в наши дни? Все так же исключительно для обеспечения совместимости. Производители справедливо полагают, что раздел с FAT32 сможет прочитать любая ОС. Поэтому именно его они создают на внешних жестких дисках, USB Flash и картах памяти.

Как освободить флеш-память смартфона

Карточки microSD(HC), используемые в смартфонах, по умолчанию отформатированы в FAT32. Это основное препятствие для установки на них приложений и переноса данных из внутренней памяти. Чтобы его преодолеть, нужно создать на карточке раздел с ext3 или ext4. На него можно перенести все файловые атрибуты (включая владельца и права доступа), поэтому любое приложение сможет работать так, словно запустилось из внутренней памяти.

Windows не умеет делать на флешках больше одного раздела, но для этого можно запустить Linux (хотя бы в виртуалке) или продвинутую утилиту для работы с логической разметкой - например, MiniTool Partition Wizard Free . Обнаружив на карточке дополнительный первичный раздел с ext3/ext4, приложение Link2SD и аналогичные ему предложат куда больше вариантов, чем в случае с одним разделом FAT32.

Как еще один аргумент в пользу выбора FAT32 часто называют отсутствие в ней журналирования, а значит, более быстрые операции записи и меньший износ ячеек памяти NAND Flash. На практике же использование FAT32 приводит к обратному и порождает множество других проблем.

Флешки и карты памяти как раз быстро умирают из-за того, что любое изменение в FAT32 вызывает перезапись одних и тех же секторов, где расположены две цепочки файловых таблиц. Сохранил веб-страничку целиком, и она перезаписалась раз сто - с каждым добавлением на флешку очередной мелкой гифки. Запустил портейбл-софт? Он насоздавал временных файлов и постоянно меняет их во время работы. Поэтому гораздо лучше использовать на флешках NTFS с ее устойчивой к сбоям таблицей $MFT. Мелкие файлы могут храниться прямо в главной файловой таблице, а ее расширения и копии записываются в разные области флеш-памяти. Вдобавок благодаря индексации на NTFS поиск выполняется быстрее.

INFO

Для FAT32 и NTFS теоретические ограничения по уровню вложенности не указаны, но на практике они одинаковые: в каталоге первого уровня можно создать только 7707 подкаталогов. Любители поиграть в матрешки оценят.

Другая проблема, с которой сталкивается большинство пользователей, - на раздел с FAT32 невозможно записать файл больше 4 Гбайт. Причина заключается в том, что в FAT32 размер файла описывается 32 битами в таблице размещения файлов, а 2^32 (минус единица, если быть точным) как раз дают четыре гига. Получается, что на свежекупленную флешку нельзя записать ни фильм в нормальном качестве, ни образ DVD.

Копирование больших файлов еще полбеды: при попытке сделать это ошибка хотя бы видна сразу. В других ситуациях FAT32 выступает в роли бомбы замедленного действия. Например, ты скопировал на флешку портейбл-софт и на первых порах пользуешься им без проблем. Спустя длительное время у одной из программ (допустим, бухгалтерской или почтовой) база данных раздувается, и... она просто перестает обновляться. Файл не может быть перезаписан, поскольку достиг лимита в 4 Гбайт.

Менее очевидная проблема заключается в том, что в FAT32 дата создания файла или каталога может быть задана с точностью до двух секунд. Этого недостаточно для многих криптографических приложений, использующих временные метки. Низкая точность атрибута «дата» - еще одна причина того, почему FAT32 не рассматривается как полноценная файловая система с точки зрения безопасности. Однако ее слабые стороны можно использовать и в своих целях. Например, если скопировать на том FAT32 любые файлы с раздела NTFS, то они очистятся от всех метаданных, а также унаследованных и специально заданных разрешений. FAT просто не поддерживает их.

exFAT

В отличие от FAT12/16/32, exFAT разрабатывалась специально для USB Flash и карт памяти большого (≥ 32 Гбайт) объема. Extended FAT устраняет упомянутый выше недостаток FAT32 - перезаписывание одних и тех же секторов при любом изменении. Как у 64-разрядной системы, у нее нет практически значимых лимитов на размер одного файла. Теоретически он может иметь длину в 2^64 байт (16 Эбайт), а карточки такого объема появятся нескоро.

Еще одно принципиальное отличие exFAT - поддержка списков контроля доступа (ACL). Это уже не та простушка из девяностых, однако внедрению exFAT мешает закрытость формата. Поддержка exFAT полноценно и легально реализована только в Windows (начиная с XP SP2) и OS X (начиная с 10.6.5). В Linux и *BSD она поддерживается либо с ограничениями, либо не вполне законно. Microsoft требует лицензировать использование exFAT, и в этой области много правовых споров.

Btrfs

Еще один яркий представитель файловых систем на основе B-деревьев называется Btrfs. Эта ФС появилась в 2007 году и изначально создавалась в Oracle с прицелом на работу с SSD и RAID. Например, ее можно динамически масштабировать: создавать новые индексные дескрипторы прямо в работающей системе или разделять том на подтома без выделения им свободного места.

Реализованный в Btrfs механизм копирования при записи и полная интеграция с модулем ядра Device mapper позволяют делать практически мгновенные снапшоты через виртуальные блочные устройства. Предварительное сжатие данных (zlib или lzo) и дедупликация ускоряют основные операции, заодно продлевая время жизни флеш-памяти. Особенно это заметно при работе с базами данных (достигается сжатие в 2–4 раза) и мелкими файлами (они записываются упорядоченно крупными блоками и могут храниться непосредственно в «листьях»).

Также Btrfs поддерживает режим полного журналирования (данных и метаданных), проверку тома без размонтирования и множество других современных фич. Код Btrfs опубликован под лицензией GPL. Эта файловая система поддерживается в Linux как стабильная начиная с версии ядра 4.3.1.

Бортовые журналы

Практически все более-менее современные файловые системы (ext3/ext4, NTFS, HFSX, Btrfs и другие) относят к общей группе журналируемых, поскольку они ведут учет вносимых изменений в отдельном логе (журнале) и сверяются с ним в случае сбоя при выполнении дисковых операций. Однако степень подробности ведения журналов и отказоустойчивость у этих файловых систем разные.

Еxt3 поддерживает три режима ведения журнала: с обратной связью, упорядоченный и полное журналирование. Первый режим подразумевает запись только общих изменений (метаданных), выполняемую асинхронно по отношению к изменениям самих данных. Во втором режиме выполняется та же запись метаданных, но строго перед внесением любых изменений. Третий режим эквивалентен полному журналированию (изменений как в метаданных, так и в самих файлах).

Целостность данных обеспечивает только последний вариант. Остальные два лишь ускоряют выявление ошибок в ходе проверки и гарантируют восстановление целостности самой файловой системы, но не содержимого файлов.

Журналирование в NTFS похоже на второй режим ведения лога в ext3. В журнал записываются только изменения в метаданных, а сами данные в случае сбоя могут быть утеряны. Такой метод ведения журнала в NTFS задумывался не как способ достижения максимальной надежности, а лишь как компромисс между быстродействием и отказоустойчивостью. Именно поэтому люди, привыкшие к работе с полностью журналируемыми системами, считают NTFS псевдожурналируемой.

Реализованный в NTFS подход в чем-то даже лучше используемого по умолчанию в ext3. В NTFS дополнительно периодически создаются контрольные точки, которые гарантируют выполнение всех отложенных ранее дисковых операций. Контрольные точки не имеют ничего общего с точками восстановления в \System Volume Infromation\ . Это просто служебные записи в логе.

Практика показывает, что такого частичного журналирования NTFS в большинстве случаев хватает для беспроблемной работы. Ведь даже при резком отключении питания дисковые устройства не обесточиваются мгновенно. Блок питания и многочисленные конденсаторы в самих накопителях обеспечивают как раз тот минимальный запас энергии, которого хватает на завершение текущей операции записи. Современным SSD при их быстродействии и экономичности такого же количества энергии обычно хватает и на выполнение отложенных операций. Попытка же перейти на полное журналирование снизила бы скорость большинства операций в разы.

Подключаем сторонние ФС в Windows

Использование файловых систем лимитировано их поддержкой на уровне ОС. Например, Windows не понимает ext2/3/4 и HFS+, а использовать их порой надо. Сделать это можно, добавив соответствующий драйвер.

WARNING

Большинство драйверов и плагинов для поддержки сторонних файловых систем имеют свои ограничения и не всегда работают стабильно. Они могут конфликтовать с другими драйверами, антивирусами и программами виртуализации.

Открытый драйвер для чтения и записи на разделы ext2/3 с частичной поддержкой ext4. В последней версии поддерживаются экстенты и разделы объемом до 16 Тбайт. Не поддерживаются LVM, списки контроля доступа и расширенные атрибуты.

Существует бесплатный плагин для Total Commander. Поддерживает чтение разделов ext2/3/4.

coLinux - открытый и бесплатный порт ядра Linux. Вместе с 32-битным драйвером он позволяет запускать Linux в среде Windows с 2000 по 7 без использования технологий виртуализации. Поддерживает только 32-битные версии. Разработка 64-битной модификации была отменена. сoLinux позволяет в том числе организовать из Windows доступ к разделам ext2/3/4. Поддержка проекта приостановлена в 2014 году.

Возможно, в Windows 10 уже есть встроенная поддержка характерных для Linux файловых систем, просто она скрыта. На эти мысли наводит драйвер уровня ядра Lxcore.sys и сервис LxssManager, который загружается как библиотека процессом Svchost.exe. Подробнее об этом смотри в докладе Алекса Ионеску «Ядро Линукс, скрытое внутри Windows 10», с которым он выступил на Black Hat 2016.

ExtFS for Windows - платный драйвер, выпускаемый компанией Paragon. Он работает в Windows с 7 по 10, поддерживает доступ к томам ext2/3/4 в режиме чтения и записи. Обеспечивает почти полную поддержку ext4 в Windows.

HFS+ for Windows 10 - еще один проприетарный драйвер производства Paragon Software. Несмотря на название, работает во всех версиях Windows начиная с XP. Предоставляет полный доступ к файловым системам HFS+/HFSX на дисках с любой разметкой (MBR/GPT).

WinBtrfs - ранняя разработка драйвера Btrfs для Windows. Уже в версии 0.6 поддерживает доступ к томам Btrfs как на чтение, так и на запись. Умеет обрабатывать жесткие и символьные ссылки, поддерживает альтернативные потоки данных, ACL, два вида компрессии и режим асинхронного чтения/записи. Пока WinBtrfs не умеет использовать mkfs.btrfs, btrfs-balance и другие утилиты для обслуживания этой файловой системы.

Возможности и ограничения файловых систем: сводная таблица

Фай-ло-вая сис-те-ма	Мак-си-маль-ный раз-мер тома	Пре-дель-ный раз-мер одного файла	Дли-на собст-вен-ного имени файла	Дли-на пол-но-го имени файла (вклю-чая путь от корня)	Пре-дель-ное число файлов и/или ката-ло-гов	Точ-ность ука-за-ния даты файла/ката-ло-га	Права дос-ту-па	Жёсткие ссылки	Сим-воль-ные ссылки	Мгно-вен-ные снимки (snap-shots)	Сжа-тие дан-ных в фоне	Шиф-ро-ва-ние дан-ных в фоне	Деду-пли-ка-ция дан-ных
FAT16	2 ГБ секторами по 512 байт или 4 ГБ кластерами по 64 КБ	2 ГБ	255 байт с LFN	-	-	-	-	-	-	-	-	-	-
FAT32	8 ТБ секторами по 2 КБ	4 ГБ (2^32 - 1 байт)	255 байт с LFN	до 32 подкаталогов с CDS	65460	10 мс (создание) / 2 с (изменение)	нет	нет	нет	нет	нет	нет	нет
exFAT	≈ 128 ПБ (2^32-1 кластеров по 2^25-1 байт) теоретически / 512 ТБ из-за сторонних ограничений	16 ЭБ (2^64 - 1 байт)			2796202 в каталоге	10 мс	ACL	нет	нет	нет	нет	нет	нет
NTFS	256 ТБ кластерами по 64 КБ или 16 ТБ кластерами по 4 КБ	16 ТБ (Win 7) / 256 ТБ (Win 8)	255 символов Unicode (UTF-16)	32760 символов Unicode, но не более 255 символов в каждом элементе	2^32-1	100 нс	ACL	да	да	да	да	да	да
HFS+	8 ЭБ (2^63 байт)	8 ЭБ	255 символов Unicode (UTF-16)	отдельно не ограничивается	2^32-1	1 с	Unix, ACL	да	да	нет	да	да	нет
APFS	8 ЭБ (2^63 байт)	8 ЭБ	255 символов Unicode (UTF-16)	отдельно не ограничивается	2^63	1 нс	Unix, ACL	да	да	да	да	да	да
Ext3	32 ТБ (теоретически) / 16 ТБ кластерами по 4 КБ (из-за ограничений утилит e2fs programs)	2 ТБ (теоретически) / 16 ГБ у старых программ	255 символов Unicode (UTF-16)	отдельно не ограничивается	-	1 с	Unix, ACL	да	да	нет	нет	нет	нет
Ext4	1 ЭБ (теоретически) / 16 ТБ кластерами по 4 КБ (из-за ограничений утилит e2fs programs)	16 ТБ	255 символов Unicode (UTF-16)	отдельно не ограничивается	4 млрд.	1 нс	POSIX	да	да	нет	нет	да	нет
F2FS	16 ТБ	3,94 ТБ	255 байт	отдельно не ограничивается	-	1 нс	POSIX, ACL	да	да	нет	нет	да	нет
BTRFS	16 ЭБ (2^64 - 1 байт)	16 ЭБ	255 символов ASCII	2^17 байт	-	1 нс	POSIX, ACL	да	да	да	да	да	да

Способность ОС к «экранированию» сложностей реальной аппаратуры очень ярко проявляется в одной из основных подсистем ОС - файловой системе . Операционная система виртуализирует отдельный набор данных, хранящихся на внешнем накопителе, в виде файла - простой неструктурированной последовательности байтов, имеющей символьное имя. Для удобства работы с данными файлы группируются в каталоги , которые, в свою очередь, образуют группы - каталоги более высокого уровня. Пользователь может с помощью ОС выполнять над файлами и каталогами такие действия, как поиск по имени, удаление, вывод содержимого на внешнее устройство (например, на дисплей), изменение и сохранение содержимого.

Чтобы представить большое количество наборов данных, разбросанных случайным образом по цилиндрам и поверхностям дисков различных типов, в виде хорошо всем знакомой и удобной иерархической структуры файлов и каталогов, операционная система должна решить множество задач. Файловая система ОС выполняет преобразование символьных имен файлов, с которыми работает пользователь или прикладной программист, в физические адреса данных на диске, организует совместный доступ к файлам, защищает их от несанкционированного доступа.

При выполнении своих функций файловая система тесно взаимодействует с подсистемой управления внешними устройствами, которая по запросам файловой системы осуществляет передачу данных между дисками и оперативной памятью.

Подсистема управления внешними устройствами, называемая также подсистемой ввода-вывода, исполняет роль интерфейса ко всем устройствам, подключенным к компьютеру. Спектр этих устройств очень обширен. Номенклатура выпускаемых накопителей на жестких, гибких и оптических дисках, принтеров, сканеров, мониторов, плоттеров, модемов, сетевых адаптеров и более специальных устройств ввода-вывода, таких как, например, аналого-цифровые преобразователи, может насчитывать сотни моделей. Эти модели могут существенно отличаться набором и последовательностью команд, с помощью которых осуществляется обмен информацией с процессором и памятью компьютера, скоростью работы, кодировкой передаваемых данных, возможностью совместного использования и множеством других деталей.

Программа, управляющая конкретной моделью внешнего устройства и учитывающая все его особенности, обычно называется драйвером этого устройства (от английского drive - управлять, вести). Драйвер может управлять единственной моделью устройства, например модемом U-1496E компании ZyXEL, или же группой устройств определенного типа, например любыми Hayes-совместимыми модемами. Для пользователя очень важно, чтобы операционная система включала как можно больше разнообразных драйверов, так как это гарантирует возможность подключения к компьютеру большого числа внешних устройств различных производителей. От наличия подходящих драйверов во многом зависит успех операционной системы на рынке (например, отсутствие многих необходимых драйверов внешних устройств было одной из причин низкой популярности OS/2).

Созданием драйверов устройств занимаются как разработчики конкретной ОС, так и специалисты компаний, выпускающих внешние устройства. Операционная система должна поддерживать хорошо определенный интерфейс между драйверами и остальной частью ОС, чтобы разработчики из компаний-производителей устройств ввода-вывода могли поставлять вместе со своими устройствами драйверы для данной операционной системы.

Прикладные программисты могут пользоваться интерфейсом драйверов при разработке своих программ, но это не очень удобно - такой интерфейс обычно представляет собой низкоуровневые операции, обремененные большим количеством деталей.

Поддержание высокоуровневого унифицированного интерфейса прикладного программирования к разнородным устройствам ввода-вывода является одной из наиболее важных задач ОС. Со времени появления ОС UNIX такой унифицированный интерфейс в большинстве операционных систем строится на основе концепции файлового доступа. Эта концепция заключается в том, что обмен с любым внешним устройством выглядит как обмен с файлом, имеющим имя и представляющим собой неструктурированную последовательность байтов. В качестве файла может выступать как реальный файл на диске, так и алфавитно-цифровой терминал, печатающее устройство или сетевой адаптер. Здесь мы опять имеем дело со свойством операционной системы подменять реальную аппаратуру удобными для пользователя и программиста абстракциями .

Задачи ОС по управлению файлами и устройствами

Подсистема ввода-вывода (Input-Output Subsystem) мультипрограммной ОС при обмене данными с внешними устройствами компьютера должна решать ряд общих задач, из которых наиболее важными являются следующие:

Организация параллельной работы устройств ввода-вывода и процессора;

Согласование скоростей обмена и кэширование данных;

Разделение устройств и данных между процессами;

Обеспечение удобного логического интерфейса между устройствами и остальной частью системы;

Поддержка широкого спектра драйверов с возможностью простого включения в систему нового драйвера;

Поддержка нескольких файловых систем;

Поддержка синхронных и асинхронных операций ввода-вывода.

Одной из основных задач операционной системы является предоставление удобств пользователю при работе с данными, хранящимися на дисках. Для этого ОС подменяет физическую структуру хранящихся данных некоторой удобной для пользователя логической моделью. Логическая модель файловой системы материализуется в виде дерева каталогов , выводимого на экран такими утилитами, как Norton Commander или Windows Explorer, в символьных составных именах файлов, в командах работы с файлами. Базовым элементом этой модели является файл , который так же, как и файловая система в целом, может характеризоваться как логической, так и физической структурой.

Файл - это именованная область внешней памяти, в которую можно записывать и из которой можно считывать данные. Файлы хранятся в памяти, на зависящей от энергопитания, обычно на магнитных дисках. Однако нет правил без исключения. Одним из таких исключений является так называемый электронный диск, когда в оперативной памяти создается структура, имитирующая файловую систему.

Основные цели использования файла:

Долговременное и надежное хранение информации. Долговременность достигается за счет использования запоминающих устройств, не зависящих от питания, а высокая надежность определяется средствами защиты доступа к файлам и общей организацией программного кода ОС, при которой сбои аппаратуры чаще всего не разрушают информацию, хранящуюся в файлах.

Совместное использование информации. Файлы обеспечивают естественный и легкий способ разделения информации между приложениями и пользователями за счет наличия понятного человеку символьного имени и постоянства хранимой информации и расположения файла. Пользователь должен иметь удобные средства работы с файлами, включая каталоги-справочники, объединяющие файлы в группы, средства поиска файлов по признакам, набор команд для создания, модификации и удаления файлов. Файл может быть создан одним пользователем, а затем использоваться совсем другим пользователем, при этом создатель файла или администратор могут определить права доступа к нему других пользователей. Эти цели реализуются в ОС файловой системой.

Файловая система (ФС) - это часть операционной системы, включающая:

Совокупность всех файлов на диске;

Наборы структур данных, используемых для управления файлами, такие, например, как каталоги файлов, дескрипторы файлов, таблицы распределения свободного и занятого пространства на диске;

Комплекс системных программных средств, реализующих различные операции над файлами, такие как создание, уничтожение, чтение, запись, именование и поиск файлов.

Файловая система позволяет программам обходиться набором достаточно простых операций для выполнения действий над некоторым абстрактным объектом, представляющим файл. При этом программистам не нужно иметь дело с деталями действительного расположения данных на диске, буферизацией данных и другими низкоуровневыми проблемами передачи данных с долговременного запоминающего устройства. Все эти функции файловая система берет на себя. Файловая система распределяет дисковую память, поддерживает именование файлов, отображает имена файлов в соответствующие адреса во внешней памяти, обеспечивает доступ к данным, поддерживает разделение, защиту и восстановление файлов.

Таким образом, файловая система играет роль промежуточного слоя, экранирующего все сложности физической организации долговременного хранилища данных, и создающего для программ более простую логическую модель этого хранилища, а также предоставляя им набор удобных в использовании команд для манипулирования файлами.

Задачи, решаемые ФС, зависят от способа организации вычислительного процесса в целом. Самый простой тип - это ФС в однопользовательских и однопрограммных ОС, к числу которых относится, например, MS-DOS. Основные функции в такой ФС нацелены на решение следующих задач:

Именование файлов;

Программный интерфейс для приложений;

Отображения логической модели файловой системы на физическую организацию хранилища данных;

Устойчивость файловой системы к сбоям питания, ошибкам аппаратных и программных средств.

Задачи ФС усложняются в операционных однопользовательских мультипрограммных ОС, которые, хотя и предназначены для работы одного пользователя, но дают ему возможность запускать одновременно несколько процессов. Одной из первых ОС этого типа стала OS/2. К перечисленным выше задачам добавляется новая задача совместного доступа к файлу из нескольких процессов. Файл в этом случае является разделяемым ресурсом, а значит, файловая система должна решать весь комплекс проблем, связанных с такими ресурсами. В частности, в ФС должны быть предусмотрены средства блокировки файла и его частей, предотвращения гонок, исключение тупиков, согласование копий и т. п.

В многопользовательских системах появляется еще одна задача: защита файлов одного пользователя от несанкционированного доступа другого пользователя. Еще более сложными становятся функции ФС, которая работает в составе сетевой ОС.

Файловые системы поддерживают несколько функционально различных типов файлов , в число которых, как правило, входят обычные файлы, файлы-каталоги, специальные файлы, именованные конвейеры, отображаемые в память файлы и другие.

Обычные файлы , или просто файлы, содержат информацию произвольного характера, которую заносит в них пользователь или которая образуется в результате работы системных и пользовательских программ. Большинство современных операционных систем (например, UNIX, Windows, OS/2) никак не ограничивает и не контролирует содержимое и структуру обычного файла. Содержание обычного файла определяется приложением, которое с ним работает. Например, текстовый редактор создает текстовые файлы, состоящие из строк символов, представленных в каком-либо коде. Это могут быть документы, исходные тексты программ и т. п. Текстовые файлы можно прочитать на экране и распечатать на принтере. Двоичные файлы не используют коды символов, они часто имеют сложную внутреннюю структуру, например исполняемый код программы или архивный файл. Все операционные системы должны уметь распознавать хотя бы один тип файлов - их собственные исполняемые файлы.

Каталоги - это особый тип файлов, которые содержат системную справочную информацию о наборе файлов, сгруппированных пользователями по какому-либо неформальному признаку (например, в одну группу объединяются файлы, содержащие документы одного договора, или файлы, составляющие один программный пакет). Во многих операционных системах в каталог могут входить файлы любых типов, в том числе другие каталоги, за счет чего образуется древовидная структура, удобная для поиска. Каталоги устанавливают соответствие между именами файлов и их характеристиками, используемыми файловой системой для управления файлами. В число таких характеристик входит, в частности, информация (или указатель на другую структуру, содержащую эти данные) о типе файла и расположении его на диске, правах доступа к файлу и датах его создания и модификации. Во всех остальных отношениях каталоги рассматриваются файловой системой как обычные файлы.

Специальные файлы - это фиктивные файлы, ассоциированные с устройствами ввода-вывода, которые используются для унификации механизма доступа к файлам и внешним устройствам. Специальные файлы позволяют пользователю выполнять операции ввода-вывода посредством обычных команд записи в файл или чтения из файла. Эти команды обрабатываются сначала программами файловой системы, а затем на некотором этапе выполнения запроса преобразуются операционной системой в команды управления соответствующим устройством.

Современные файловые системы поддерживают и другие типы файлов, такие как символьные связи, именованные конвейеры, отображаемые в память файлы.

Пользователи обращаются к файлам по символьным именам . Однако способности человеческой памяти ограничивают количество имен объектов, к которым пользователь может обращаться по имени. Иерархическая организация пространства имен позволяет значительно расширить эти границы. Именно поэтому большинство файловых систем имеет иерархическую структуру, в которой уровни создаются за счет того, что каталог более низкого уровня может входить в каталог более высокого уровня (рисунок 2.16).

Рисунок 2.16. Иерархия файловых систем (а – одноуровневая структура, б – древовидная структура, в – сетевая структура)

Граф, описывающий иерархию каталогов, может быть деревом или сетью. Каталоги образуют дерево, если файлу разрешено входить только в один каталог (рисунок 2.16, б), и сеть - если файл может входить сразу в несколько каталогов (рисунок 2.16, в). Например, в MS-DOS и Windows каталоги образуют древовидную структуру, а в UNIX - сетевую. В древовидной структуре каждый файл является листом. Каталог самого верхнего уровня называется корневым каталогом , или корнем (root).

При такой организации пользователь освобожден от запоминания имен всех файлов, ему достаточно примерно представлять, к какой группе может быть отнесен тот или иной файл, чтобы путем последовательного просмотра каталогов найти его. Иерархическая структура удобна для многопользовательской работы: каждый пользователь со своими файлами локализуется в своем каталоге или поддереве каталогов, и вместе с тем все файлы в системе логически связаны.

Частным случаем иерархической структуры является одноуровневая организация, когда все файлы входят в один каталог (рисунок 2.16, а).

Все типы файлов имеют символьные имена. В иерархически организованных файловых системах обычно используются три типа имен файлов: простые, составные и относительные.

Простое, или короткое, символьное имя идентифицирует файл в пределах одного каталога. Простые имена присваивают файлам пользователи и программисты, при этом они должны учитывать ограничения ОС как на номенклатуру символов, так и на длину имени. До сравнительно недавнего времени эти границы были весьма узкими. Так, в популярной файловой системе FAT длина имен ограничивались схемой 8.3 (8 символов - собственно имя, 3 символа - расширение имени), а в файловой системе s5, поддерживаемой многими версиями ОС UNIX, простое символьное имя не могло содержать более 14 символов. Однако пользователю гораздо удобнее работать с длинными именами, поскольку они позволяют дать файлам легко запоминающиеся названия, ясно говорящие о том, что содержится в этом файле. Поэтому современные файловые системы, а также усовершенствованные варианты уже существовавших файловых систем, как правило, поддерживают длинные простые символьные имена файлов. Например, в файловых сиетемах NTFS и FAT32, входящих в состав операционной системы Windows NT, имя файла может содержать до 255 символов.

В иерархических файловых системах разным файлам разрешено иметь одинаковые простые символьные имена при условии, что они принадлежат разным каталогам. То есть здесь работает схема «много файлов - одно простое имя». Для однозначной идентификации файла в таких системах используется так называемое полное имя.

Полное имя представляет собой цепочку простых символьных имен всех каталогов, через которые проходит путь от корня до данного файла. Таким образом, полное имя является составным, в котором простые имена отделены друг от друга принятым в ОС разделителем. Часто в качестве разделителя используется прямой или обратный слеш, при этом принято не указывать имя корневого каталога. На рисунке 2.16, б два файла имеют простое имя main.exe, однако их составные имена /depart/main.ехе и /user/anna/main.exe различаются.

В древовидной файловой системе между файлом и его полным именем имеется взаимно однозначное соответствие «один файл - одно полное имя». В файловых системах, имеющих сетевую структуру, файл может входить в несколько каталогов, а значит, иметь несколько полных имен; здесь справедливо соответствие «один файл - много полных имен». В обоих случаях файл однозначно идентифицируется полным именем.

Файл может быть идентифицирован также относительным именем. Относительное имя файла определяется через понятие «текущий каталог». Для каждого пользователя в каждый момент времени один из каталогов файловой системы является текущим, причем этот каталог выбирается самим пользователем по команде ОС. Файловая система фиксирует имя текущего каталога, чтобы затем использовать его как дополнение к относительным именам для образования полного имени файла. При использовании относительных имен пользователь идентифицирует файл цепочкой имен каталогов, через которые проходит маршрут от текущего каталога до данного файла. Например, если текущим каталогом является каталог /user, то относительное имя файла /user/anna/main.exe выглядит следующим образом: anna/ main.exe.

В некоторых операционных системах разрешено присваивать одному и тому же файлу несколько простых имен, которые можно интерпретировать как псевдонимы. В этом случае, так же как в системе с сетевой структурой, устанавливается соответствие «один файл - много полных имен», так как каждому простому имени файла соответствует по крайней мере одно полное имя.

И хотя полное имя однозначно определяет файл, операционной системе проще работать с файлом, если между файлами и их именами имеется взаимно однозначное соответствие. С этой целью она присваивает файлу уникальное имя, так что справедливо соотношение «один файл - одно уникальное имя». Уникальное имя существует наряду с одним или несколькими символьными именами, присваиваемыми файлу пользователями или приложениями. Уникальное имя представляет собой числовой идентификатор и предназначено только для операционной системы. Примером такого уникального имени файла является номер индексного дескриптора в системе UNIX.

Понятие «файл» включает не только хранимые им данные и имя, но и атрибуты. Атрибуты - это информация, описывающая свойства файла. Примеры возможных атрибутов файла:

Тип файла (обычный файл, каталог, специальный файл и т. п.);

Владелец файла;

Создатель файла;

Пароль для доступа к файлу;

Информация о разрешенных операциях доступа к файлу;

Времена создания, последнего доступа и последнего изменения;

Текущий размер файла;

Максимальный размер файла;

Признак «только для чтения»;

Признак «скрытый файл»;

Признак «системный файл»;

Признак «архивный файл»;

Признак «двоичный/символьный»;

Признак «временный» (удалить после завершения процесса);

Признак блокировки;

Длина записи в файле;

Указатель на ключевое поле в записи;

Длина ключа.

Набор атрибутов файла определяется спецификой файловой системы: в файловых системах разного типа для характеристики файлов могут использоваться разные наборы атрибутов. Например, в файловых системах, поддерживающих неструктурированные файлы, нет необходимости использовать три последних атрибута в приведенном списке, связанных со структуризацией файла. В однопользовательской ОС в наборе атрибутов будут отсутствовать характеристики, имеющие отношение к пользователям и защите, такие как владелец файла, создатель файла, пароль для доступа к файлу, информация о разрешенном доступе к файлу.

Пользователь может получать доступ к атрибутам, используя средства, предоставленные для этих целей файловой системой. Обычно разрешается читать значения любых атрибутов, а изменять - только некоторые. Например, пользователь может изменить права доступа к файлу (при условии, что он обладает необходимыми для этого полномочиями), но изменять дату создания или текущий размер файла ему не разрешается.

Значения атрибутов файлов могут непосредственно содержаться в каталогах, как это сделано в файловой системе MS-DOS (рисунок 2.17, а). На рисунке представлена структура записи в каталоге, содержащая простое символьное имя и атрибуты файла. Здесь буквами обозначены признаки файла: R - только для чтения, А - архивный, Н - скрытый, S - системный.

Рисунок 2.17. Структура каталогов: а - структура записи каталога MS-DOS (32 байта), б - структура записи каталога ОС UNIX

Другим вариантом является размещение атрибутов в специальных таблицах, когда в каталогах содержатся только ссылки на эти таблицы. Такой подход реализован, например, в файловой системе ufs ОС UNIX. В этой файловой системе структура каталога очень простая. Запись о каждом файле содержит короткое символьное имя файла и указатель на индексный дескриптор файла, так называется в ufs таблица, в которой сосредоточены значения атрибутов файла (рисунок 2.17, б).

В том и другом вариантах каталоги обеспечивают связь между именами файлов и собственно файлами. Однако подход, когда имя файла отделено от его атрибутов, делает систему более гибкой. Например, файл может быть легко включен сразу в несколько каталогов. Записи об этом файле в разных каталогах могут содержать разные простые имена, но в поле ссылки будет указан один и тот же номер индексного дескриптора.

Представление пользователя о файловой системе как об иерархически организованном множестве информационных объектов имеет мало общего с порядком хранения файлов на диске. Файл, имеющий образ цельного, непрерывающегося набора байт, на самом деле очень часто разбросан «кусочками» по всему диску, причем это разбиение никак не связано с логической структурой файла, например, его отдельная логическая запись может быть расположена в несмежных секторах диска. Логически объединенные файлы из одного каталога совсем не обязаны соседствовать на диске. Принципы размещения файлов, каталогов и системной информации на реальном устройстве описываются физической организацией файловой системы. Очевидно, что разные файловые системы имеют разную физическую организацию.

Основным типом устройства, которое используется в современных вычислительных системах для хранения файлов, являются дисковые накопители. Эти устройства предназначены для считывания и записи данных на жесткие и гибкие магнитные диски. Жесткий диск состоит из одной или нескольких стеклянных или металлических пластин, каждая из которых покрыта с одной или двух сторон магнитным материалом. Таким образом, диск в общем случае состоит из пакета пластин (рисунок 2.18).

На каждой стороне каждой пластины размечены тонкие концентрические кольца - дорожки (traks), на которых хранятся данные. Количество дорожек зависит от типа диска. Нумерация дорожек начинается с 0 от внешнего края к центру диска. Когда диск вращается, элемент, называемый головкой, считывает двоичные данные с магнитной дорожки или записывает их на магнитную дорожку.

Рисунок 2.18. Схема устройства жесткого диска

Головка может позиционироваться над заданной дорожкой. Головки перемещаются над поверхностью диска дискретными шагами, каждый шаг соответствует сдвигу на одну дорожку. Запись на диск осуществляется благодаря способности головки изменять магнитные свойства дорожки. В некоторых дисках вдоль каждой поверхности перемещается одна головка, а в других - имеется по головке на каждую дорожку. В первом случае для поиска информации головка должна перемещаться по радиусу диска. Обычно все головки закреплены на едином перемещающем механизме и двигаются синхронно. Поэтому, когда головка фиксируется на заданной дорожке одной поверхности, все остальные головки останавливаются над дорожками с такими же номерами. В тех же случаях, когда на каждой дорожке имеется отдельная головка, никакого перемещения головок с одной дорожки на другую не требуется, за счет этого экономится время, затрачиваемое на поиск данных.

Совокупность дорожек одного радиуса на всех поверхностях всех пластин пакета называется цилиндром (cylinder). Каждая дорожка разбивается на фрагменты, называемые секторами (sectors), или блоками (blocks), так что все дорожки имеют равное число секторов, в которые можно максимально записать одно и то же число байт. Сектор имеет фиксированный для конкретной системы размер, выражающийся степенью двойки. Чаще всего размер сектора составляет 512 байт. Учитывая, что дорожки разного радиуса имеют одинаковое число секторов, плотность записи становится тем выше, чем ближе дорожка к центру.

Сектор - наименьшая адресуемая единица обмена данными дискового устройства с оперативной памятью. Для того чтобы контроллер мог найти на диске нужный сектор, необходимо задать ему все составляющие адреса сектора: номер цилиндра, номер поверхности и номер сектора. Так как прикладной программе в общем случае нужен не сектор, а некоторое количество байт, не обязательно кратное размеру сектора, то типичный запрос включает чтение нескольких секторов, содержащих требуемую информацию, и одного или двух секторов, содержащих наряду с требуемыми избыточные данные (рисунок 2.19).

Рисунок 2.19. Считывание избыточных данных при обмене с диском

Операционная система при работе с диском использует, как правило, собственную единицу дискового пространства, называемую кластером (cluster). При создании файла место на диске ему выделяется кластерами. Например, если файл имеет размер 2560 байт, а размер кластера в файловой системе определен в 1024 байта, то файлу будет выделено на диске 3 кластера.

Дорожки и секторы создаются в результате выполнения процедуры физического, или низкоуровневого, форматирования диска, предшествующей использованию диска. Для определения границ блоков на диск записывается идентификационная информация. Низкоуровневый формат диска не зависит от типа операционной системы, которая этот диск будет использовать.

Разметку диска под конкретный тип файловой системы выполняют процедуры высокоуровневого, или логического, форматирования.

При высокоуровневом форматировании определяется размер кластера и на диск записывается информация, необходимая для работы файловой системы, в том числе информация о доступном и неиспользуемом пространстве, о границах областей, отведенных под файлы и каталоги, информация о поврежденных областях. Кроме того, на диск записывается загрузчик операционной системы - небольшая программа, которая начинает процесс инициализации операционной системы после включения питания или рестарта компьютера.

Прежде чем форматировать диск под определенную файловую систему, он может быть разбит на разделы. Раздел - это непрерывная часть физического диска, которую операционная система представляет пользователю как логическое устройство (используются также названия логический диск и логический раздел). Логическое устройство функционирует так, как если бы это был отдельный физический диск. Именно с логическими устройствами работает пользователь, обращаясь к ним по символьным именам, используя, например, обозначения А, В, С, SYS и т. п. Операционные системы разного типа используют единое для всех них представление о разделах, но создают на его основе логические устройства, специфические для каждого типа ОС. Так же как файловая система, с которой работает одна ОС, в общем случае не может интерпретироваться ОС другого типа, логические устройства не могут быть использованы операционными системами разного типа. На каждом логическом устройстве может создаваться только одна файловая система .

Файлы и файловая система

Все программы и данные хранятся в долговременной (внешней) памяти компьютера в виде файлов.

Файл - это определенное количество информации (программа или данные), имеющее имя и хранящееся в долговременной (внешней) памяти.

Имя файла. Имя файла состоит из двух частей, разделенных точкой: собственно имя файла и расширение, определяющее его тип (программа, данные и так далее). Собственно имя файлу дает пользователь, а тип файла обычно задается программой автоматически при его создании (табл. 4.2).

В различных операционных системах существуют различные форматы имен файлов. В операционной системе MS-DOS собственно имя файла должно содержать не более 8 букв латинского алфавита, цифр и некоторых специальных знаков, а расширение состоит из трех латинских букв, например: proba.txt

В операционной системе Windows имя файла может иметь длину до 255 символов, причем можно использовать русский алфавит, например: Единицы измерения информации.doc

Файловая система. На каждом носителе информации (гибком, жестком или лазерном диске) может храниться большое количество файлов. Порядок хранения файлов на диске определяется используемой файловой системой.

Каждый диск разбивается на две области: область хранения файлов и каталог. Каталог содержит имя файла и указание на начало его размещения на диске. Если провести аналогию диска с книгой, то область хранения файлов соответствует ее содержанию, а каталог - оглавлению. Причем книга состоит из страниц, а диск - из секторов.

Для дисков с небольшим количеством файлов (до нескольких десятков) может использоваться одноуровневая файловая система , когда каталог (оглавление диска) представляет собой линейную последовательность имен файлов (табл. 4.3). Такой каталог можно сравнить с оглавлением детской книжки, которое содержит только названия отдельных рассказов.

Если на диске хранятся сотни и тысячи файлов, то для удобства поиска используется многоуровневая иерархическая файловая система , которая имеет древовидную структуру. Такую иерархическую систему можно сравнить, например, с оглавлением данного учебника, которое представляет собой иерархическую систему разделов, глав, параграфов и пунктов.

Начальный, корневой каталог содержит вложенные каталоги 1-го уровня, в свою очередь, каждый из последних может содержать вложенные каталоги 2-го уровня и так далее. Необходимо отметить, что в каталогах всех уровней могут храниться и файлы.

Например, в корневом каталоге могут находиться два вложенных каталога 1-го уровня (Каталог_1, Каталог_2) и один файл (Файл_1). В свою очередь, в каталоге 1-го уровня (Каталог_1) находятся два вложенных каталога второго уровня (Каталог_1.1 и Каталог_1.2) и один файл (Файл_1.1) - рис. 4.21.

Файловая система - это система хранения файлов и организации каталогов.

Рассмотрим иерархическую файловую систему на конкретном примере. Каждый диск имеет логическое имя (А:, В: - гибкие диски, С:, D:, Е: и так далее - жесткие и лазерные диски).

Пусть в корневом каталоге диска С: имеются два каталога 1-го уровня (GAMES, TEXT), а в каталоге GAMES один каталог 2-го уровня (CHESS). При этом в каталоге TEXT имеется файл proba.txt, а в каталоге CHESS - файл chess.exe (рис. 4.22).

Путь к файлу. Как найти имеющиеся файлы (chess.exe, proba.txt) в данной иерархической файловой системе? Для этого необходимо указать путь к файлу. В путь к файлу входят записываемые через разделитель "\" логическое имя диска и последовательность имен вложенных друг в друга каталогов, в последнем из которых содержится нужный файл. Пути к вышеперечисленным файлам можно записать следующим образом:

Путь к файлу вместе с именем файла называют иногда полным именем файла .

Пример полного имени файла:

С \GAMES\CHESS\chess.exe

Представление файловой системы с помощью графического интерфейса. Иерархическая файловая система MS-DOS, содержащая каталоги и файлы, представлена в операционной системе Windows с помощью графического интерфейса в форме иерархической системы папок и документов. Папка в Windows является аналогом каталога MS-DOS

Однако иерархическая структура этих систем несколько различается. В иерархической файловой системе MS-DOS вершиной иерархии объектов является корневой каталог диска, который можно сравнить со стволом дерева, на котором растут ветки (подкаталоги), а на ветках располагаются листья (файлы).

В Windows на вершине иерархии папок находится папка Рабочий стол . Следующий уровень представлен папками Мой компьютер, Корзина и Сетевое окружение (если компьютер подключен к локальной сети) - рис. 4.23.

2. Выбрав один из пунктов меню Вид (Крупные значки, Мелкие значки, Список, Таблица) , можно настроить форму представления содержимого папки.

Папка Сетевое окружение содержит папки всех компьютеров, подключенных в данный момент к локальной сети.

Папка Корзина временно содержит все удаленные папки и файлы. При необходимости удаленные и хранящиеся в Корзине папки и документы можно восстановить.

3. Для окончательного удаления файлов необходимо ввести команду [Файл-Очистить корзину].

Операции над файлами. В процессе работы на компьютере наиболее часто над файлами производятся следующие операции:

копирование (копия файла помещается в другой каталог);
перемещение (сам файл перемещается в другой каталог);
удаление (запись о файле удаляется из каталога);
переименование (изменяется имя файла).

Графический интерфейс Windows позволяет проводить операции над файлами с помощью мыши с использованием метода Drag&Drop (перетащи и оставь). Существуют также специализированные приложения для работы с файлами, так называемые файловые менеджеры : Norton Commander, Windows Commander, Проводник и др.

В некоторых случаях возникает необходимость работать с интерфейсом командной строки. В Windows предусмотрен режим работы с интерфейсом командной строки MS-DOS.

Интерфейс командной строки

1. Ввести команду [Программы-Сеанс MS-DOS]. Появится окно приложения Сеанс MS-DOS .

В ответ на приглашение системы можно вводить команды MS-DOS с клавиатуры, в том числе:

команды работы с файлами (copy, del, rename и др.);
команды работы с каталогами (dir, mkdir, chdir и др.);
команды работы с дисками (format, defrag и др.).

2. Существуют десятки команд MS-DOS, при этом каждая команда имеет свой формат и параметры, запомнить которые достаточно трудно. Для того чтобы получить справочную информацию по команде, необходимо после имени команды ввести ключ /?.

Например, для получения справки по команде format в ответ на приглашение системы необходимо ввести: С:\WINDOWS>format/?

Вопросы для размышления

1. Какой элемент является вершиной иерархии в файловой системе MS-DOS? В графическом интерфейсе Windows?

Практические задания

4.11. Осуществить копирование файлов с использованием интерфейса командной строки и файлового менеджера.

4.12. Ознакомиться с объемом дисков вашего компьютера, а также объемами занятого и свободного пространства.

4.13. Ознакомиться с форматом команды dir. Просмотреть корневой каталог диска С.

Рано или поздно начинающий пользователь компьютера сталкивается с таким понятием, как файловая система (ФС). Как правило, впервые знакомство с данным термином происходит при форматировании носителя информации: логические диски и подключаемые носители (флешки, карты памяти, внешний жесткий диск).

Перед форматированием операционная система Windows предлагает выбрать вид файловой системы на носителе, размер кластера, способ форматирования (быстрое или полное). Давайте разберемся, что же такое файловая система и для чего она нужна?

Вся информация записывается на носитель в виде , которые должны располагаться в определенном порядке, иначе операционная система и программы не смогут оперировать с данными. Этот порядок и организует файловая система с помощью определенных алгоритмов и правил размещения файлов на носителе.

Когда программе требуется файл, записанный на диске, ей нет необходимости знать, как и где он хранится. Все, что от программы требуется – это знать имя файла, его размер и атрибуты, чтобы передать эти данные файловой системе, которая обеспечит доступ к нужному файлу. То же самое происходит и при записи данных на носитель: программа передает информацию о файле (имя, размер, атрибуты) файловой системе, которая сохраняет его по своим определенным правилам.

Для лучшего понимания представьте библиотекаря, который выдает клиенту книгу по ее названию. Или в обратном порядке: клиент сдает прочитанную книгу библиотекарю, который размещает ее обратно на хранение. Клиенту совсем нет необходимости знать, где и как хранится книга, это обязанность служащего заведения. Библиотекарь знает правила каталогизации библиотеки и согласно этим правилам разыскивает издание или размещает его обратно, т.е. выполняет свои служебные функции. В данном примере библиотека – это носитель информации, библиотекарь – файловая система, клиент – программа.

Основные функции файловой системы

Основными функциями файловой системы являются:

размещение и упорядочивание на носителе данных в виде файлов;
определение максимально поддерживаемого объема данных на носителе информации;
создание, чтение и удаление файлов;
назначение и изменение атрибутов файлов (размер, время создания и изменения, владелец и создатель файла, доступен только для чтения, скрытый файл, временный файл, архивный, исполняемый, максимальная длина имени файла и т.п.);
определение структуры файла;
организация каталогов для логической организации файлов;
защита файлов при системном сбое;
защита файлов от несанкционированного доступа и изменения их содержимого.

Информация, записываемая на жесткий диск или любой другой носитель, размещается в нем на основе кластерной организации. Кластер представляют собой своего рода ячейку определенного размера, в которую помещается весь файл или его часть.

Если файл имеет размер кластера, то он занимает только один кластер. Если размер файла превышает размер ячейки, то он размещается в нескольких ячейках-кластерах. Причем свободные кластеры могут находиться не рядом с другом, а быть разбросанными по физической поверхности диска. Такая система позволяет наиболее рационально использовать место при хранении файлов. Задача файловой системы — разложить файл при записи по свободным кластерам оптимальным образом, а также собрать его при чтении и выдать программе или операционной системе.

Виды файловых систем

В процессе эволюции компьютеров, носителей информации и операционных систем возникало и пропадало большое количество файловых систем. В процессе такого эволюционного отбора, на сегодня для работы с жесткими дисками и внешними накопителями (флешки, карты памяти, внешние винчестеры, компакт диски) в основном используются следующие виды ФС:

FAT32
ISO9660

Последние две системы предназначены для работы с компакт дисками. Файловые системы Ext3 и Ext4 работают с операционными системами на основе Linux. NFS Plus – это ФС для операционных систем OS X, используемых в компьютерах фирмы Apple.

Самое большое распространение получили файловые системы NTFS и FAT32 и это не удивительно, т.к. они предназначены для операционных систем Windows, под управлением которых работает подавляющее большинство компьютеров в мире.

Сейчас FAT32 активно вытесняется более продвинутой системой NTFS по причине ее большей надежности к сохранности и защите данных. К тому же последние версии ОС Windows просто не дадут себя установить, если раздел жесткого диска будет отформатирован в FAT32. Программа установки потребует отформатировать раздел в NTFS.

Файловая система NTFS поддерживает работу с дисками объемом в сотни терабайт и размером одного файла до 16 терабайт.

Файловая система FAT32 поддерживает диски до 8 терабайт и размер одного файла до 4Гб. Чаще всего данную ФС используют на флешках и картах памяти. Именно в FAT32 форматируют внешние накопители на заводе.

Однако ограничение на размер файла в 4Гб на сегодня уже является большим минусом, т.к. в связи с распространением высококачественного видео, размер файла с фильмом будет превышать это ограничение и его будет невозможно записать на носитель.

Поделиться.

Зачем компьютеру нужна файловая система – основные типы. Файловые системы. Структура файловой системы Характеристика и назначение файловой системы

Введение

Черный ящик

Общие корни

Флеш-память как двигатель прогресса

От JFFS к F2FS

Экстенты и битовые карты

Диета с ограничением FAT

Загадка

Как освободить флеш-память смартфона

INFO

exFAT

Btrfs

Бортовые журналы

Подключаем сторонние ФС в Windows

WARNING

Возможности и ограничения файловых систем: сводная таблица

Файлы и файловая система

Основные функции файловой системы

Виды файловых систем

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Ваш комментарий (необязательно):