Учебная работа. Реферат: Физическая организация файловой системы

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (8 оценок, среднее: 4,75 из 5)
Загрузка...
Контрольные рефераты

Учебная работа. Реферат: Физическая организация файловой системы

СОДЕРЖАНИЕ

1.ФИЗИЧЕСКАЯ ОРГАНИЗАЦИЯ ФАЙЛОВОЙ системы

2.ДИСКИ, РАЗДЕЛЫ, СЕКТОРЫ, КЛАСТЕРЫ

3.ФЛЭШ-память

4.Использованная Литература

1. ФИЗИЧЕСКАЯ ОРГАНИЗАЦИЯ ФАЙЛОВОЙ системы

Представление юзера о файловой системе как о иерархически организованном огромном количестве информационных объектов имеет не достаточно общего с порядком хранения файлов на диске. файл, имеющий образ цельного, непрерывающегося набора б, по сути весьма нередко разбросан «кусками» по всему диску, при этом это разбиение никак не соединено с логической структурой файла, к примеру, его отдельная логическая запись быть может размещена в несмежных секторах диска. Логически объединенные файлы из 1-го каталога совершенно не должны соседствовать на диске. Принципы размещения файлов, каталогов и системной инфы на настоящем устройстве описываются физической организацией файловой системы. Разумеется, что различные файловые системы имеют разную физическую компанию.

2. ДИСКИ, РАЗДЕЛЫ, СЕКТОРЫ, КЛАСТЕРЫ

Главным типом устройства, которое употребляется в современных вычислительных системах для хранения файлов, являются дисковые накопители. Эти устройства предусмотрены для считывания и записи данных на твердые и гибкие магнитные диски. Твердый диск состоит из одной либо нескольких стеклянных либо железных пластинок, любая из которых покрыта с одной либо 2-ух сторон магнитным материалом. Таковым образом, диск в общем случае состоит из пакета пластинок (рис. 1).

На каждой стороне каждой пластинки размечены тонкие концентрические кольца — дорожки (traks), на которых хранятся данные. количество дорожек зависит от типа диска. Нумерация дорожек начинается с 0 от наружного края к центру диска. Когда диск вращается, элемент, именуемый головкой, считывает двоичные данные с магнитной дорожки либо записывает их на магнитную дорожку.

Рис. 1. Схема устройства твердого диска

Головка может позиционироваться над данной дорожкой. Головки передвигаются над поверхностью диска дискретными шагами, любой шаг соответствует сдвигу на одну дорожку. Запись на диск осуществляется благодаря возможности головки изменять магнитные характеристики дорожки. В неких дисках вдоль каждой поверхности {перемещается} одна головка, а в остальных — имеется по головке на каждую дорожку. В первом случае для поиска инфы головка обязана передвигаться по радиусу диска. Обычно все головки закреплены на едином перемещающем механизме и двигаются синхронно. Потому, когда головка фиксируется на данной дорожке одной поверхности, все другие головки останавливаются над дорожками с таковыми же номерами. В тех же вариантах, когда на каждой дорожке имеется отдельная головка, никакого перемещения головок с одной дорожки на другую не требуется, из-за этого экономится время, затрачиваемое на поиск данных.

Совокупа дорожек 1-го радиуса на всех поверхностях всех пластинок пакета именуется цилиндром (cylinder). Любая дорожка разбивается на фрагменты, именуемые секторами (sectors), либо блоками (blocks), так что все дорожки имеют равное число секторов, в которые можно очень записать одно и то же число б. Сектор имеет фиксированный для определенной системы размер, выражающийся степенью двойки. Почаще всего размер сектора составляет 512 б. Беря во внимание, что дорожки различного радиуса имеют однообразное число секторов, плотность записи становится тем выше, чем поближе дорожка к центру. Сектор — меньшая адресуемая единица обмена данными дискового устройства с оперативной памятью. Для того чтоб контроллер мог отыскать на диске подходящий сектор, нужно задать ему все составляющие адреса сектора: номер цилиндра, номер поверхности и номер сектора. Потому что прикладной программке в общем случае нужен не сектор, а некое количество б, не непременно кратное размеру сектора, то обычный запрос включает чтение нескольких секторов, содержащих требуемую информацию, и 1-го либо 2-ух секторов, содержащих вместе с требуемыми лишниие данные (рис. 2).

Рис. 2. Считывание лишних данных при обмене с диском

Операционная система при работе с диском употребляет, как правило, свою единицу дискового места, именуемую кластером (cluster). При разработке файла пространство на диске ему выделяется кластерами. к примеру, если файл имеет размер 2560 б, а размер кластера в файловой системе определен в 1024 б, то файлу будет выделено на диске 3 кластера.

Дорожки и секторы создаются в итоге выполнения процедуры физического, либо низкоуровневого, форматирования диска, предыдущей использованию диска. Для определения границ блоков на диск записывается идентификационная информация. Низкоуровневый формат диска не зависит от типа операционной системы, которая этот диск будет употреблять.

Разметку диска под определенный тип файловой системы делают процедуры высокоуровневого, либо логического, форматирования. При высокоуровневом форматировании определяется размер кластера и на диск записывается информация, нужная для работы файловой системы, в том числе информация о доступном и неиспользуемом пространстве, о границах областей, отведенных под файлы и сборники, информация о покоробленных областях. Не считая того, на диск записывается загрузчик операционной системы — маленькая программка, которая начинает процесс инициализации операционной системы опосля включения питания либо рестарта компа.

До этого чем форматировать диск под определенную файловую систему, он быть может разбит на разделы. Раздел — это непрерывная часть физического диска, которую операционная система представляет юзеру как логическое устройство (употребляются также наименования логический диск и логический раздел). Логическое устройство работает так, как если б это был отдельный физический диск. Конкретно с логическими устройствами работает юзер, обращаясь к ним по символьным именам, используя, к примеру, обозначения А, В, С, SYS и т. п. Операционные системы различного типа употребляют единое для всех их одна ОС, в общем случае не может интерпретироваться ОС другого типа, логические устройства не могут быть применены операционными системами различного типа. На любом логическом устройстве может создаваться лишь одна файловая система.

В личном случае, когда все дисковое место охватывается одним разделом, логическое устройство представляет физическое устройство в целом. Если диск разбит на несколько разделов, то для всякого из этих разделов быть может сотворено отдельное логическое устройство. Логическое устройство быть может сотворено и на базе нескольких разделов, при этом эти разделы не непременно должны принадлежать одному физическому устройству. Объединение нескольких разделов в единое логическое устройство может производиться различными методами и преследовать различные цели, главные из которых: повышение общего размера логического раздела, увеличение производительности и отказоустойчивости. Примерами организации совместной работы нескольких дисковых разделов являются так именуемые RAID-массивы, подробнее о которых будет сказано дальше. На различных логических устройствах 1-го и такого же физического диска могут размещаться файловые системы различного типа. На рис. 3 показан пример диска, разбитого на три раздела, в каких установлены две файловых системы NTFS (разделы С и Е) и одна файловая система FAT (раздел D).

Все разделы 1-го диска имеют однообразный размер блока, определенный для данного диска в итоге низкоуровневого форматирования. Но в итоге высокоуровневого форматирования в различных разделах 1-го и такого же диска, представленных различными логическими устройствами, могут быть установлены файловые системы, в каких определены кластеры различающихся размеров.

Операционная система может поддерживать различные статусы разделов, особенным образом отмечая разделы, которые могут быть применены для загрузки модулей операционной системы, и разделы, в каких можно устанавливать лишь приложения и хранить файлы данных. один из разделов диска помечается как загружаемый (либо активный) Конкретно из этого раздела считывается загрузчик операционной системы.


Рис. 3. Разбиение диска на разделы

Принципиальным компонентом физической организации файловой системы является физическая организация файла, другими словами метод размещения файла на диске. Главными аспектами эффективности физической организации файлов являются:

скорость доступа к данным;

размер адресной инфы файла;

степень фрагментированности дискового места;

очень вероятный размер файла.

Непрерывное размещение — простой вариант физической организации (рис. 4, а), при котором файлу предоставляется последовательность кластеров диска, образующих непрерывный участок дисковой памяти. Главным достоинством этого способа является высочайшая скорость доступа, потому что Издержки на поиск и считывание кластеров файла малы. Также мал размер адресной инфы — довольно хранить лишь номер первого кластера и размер файла Данная физическая организация очень вероятный размер файла не ограничивает. Но этот вариант имеет значительные недочеты, которые затрудняют его применимость на практике, невзирая на всю его логическую простоту. При наиболее пристальном рассмотрении оказывается, что воплотить эту схему не так просто Вправду, какого размера обязана быть непрерывная область, выделяемая файлу, если файл при каждой модификации может прирастить собственный размер? Еще наиболее суровой неувязкой является фрагментация. Спустя некое время опосля сотворения файловой системы в итоге выполнения бессчетных операций сотворения и удаления файлов место диска неизбежно преобразуется в «лоскутное одеяло», включающее огромное число вольных областей маленького размера. Как постоянно бывает при фрагментации, суммарный размер вольной памяти быть может весьма огромным, а избрать пространство для размещения файла полностью нереально. Потому на практике употребляются способы, в каких файл располагается в нескольких, в общем случае несмежных областях диска.

Рис. 4. Физическая организация файла: непрерывное размещение (а); связанный перечень кластеров (б); связанный перечень индексов (в); список номеров кластеров (г)

Последующий метод физической организации — размещение файла в виде связанного перечня кластеров дисковой памяти (рис. 7.11, б). При таком методе сначала всякого кластера содержится указатель на последующий кластер. В этом случае адресная информация мала: размещение файла быть может задано одним числом — номером первого кластера. В отличие от предшествующего метода любой кластер быть может присоединен к цепочке кластеров какого-нибудь файла, как следует, фрагментация на уровне кластеров отсутствует. файл может изменять собственный размер во время собственного существования, наращивая число кластеров. Недочетом является сложность реализации доступа к произвольно данному месту файла — чтоб прочесть 5-ый по порядку кластер файла, нужно поочередно прочесть четыре первых кластера, прослеживая цепочку номеров кластеров. Не считая того, при всем этом методе количество данных файла, содержащихся в одном кластере, не равно степени двойки (одно слово израсходовано на номер последующего кластера), а почти все программки читают данные кластерами, размер которых равен степени двойки.

Пользующимся популярностью методом, используемым, к примеру, в файловой системе FAT, является внедрение связанного перечня индексов (рис. 4, б). Этот метод является некой модификацией предшествующего. Файлу также выделяется память в виде связанного перечня кластеров. Номер первого кластера запоминается в записи каталога, где хранятся свойства этого файла. Остальная адресная информация разделена от кластеров файла. С каждым кластером диска связывается некий элемент — индекс. Индексы размещаются в отдельной области диска — в MS-DOS это таблица FAT (File Allocation Table), занимающая один кластер. Когда память свободна, все индексы имеют нулевое кластер является для файла крайним. Индекс же предшествующего кластера файла воспринимает

При таковой физической организации сохраняются все плюсы предшествующего метода: минимальность адресной инфы, отсутствие фрагментации, отсутствие заморочек при изменении размера. Не считая того, данный метод владеет доп преимуществами. Во-1-х, для доступа к произвольному кластеру файла не требуется поочередно считывать его кластеры, довольно прочесть лишь секторы диска, содержащие таблицу индексов, отсчитать необходимое количество кластеров файла по цепочке и найти номер подходящего кластера. Во-2-х, данные файла заполняют кластер полностью, а означает, имеют размер, равный степени двойки.

ПРИМЕЧАНИЕ

нужно отметить, что при отсутствии фрагментации на уровне кластеров на диске все равно имеется определенное количество областей памяти маленького размера, которые нереально употреблять, другими словами фрагментация все таки существует. Эти фрагменты представляют собой неиспользуемые части крайних кластеров, назначенных файлам, так как размер файла в общем случае не кратен размеру кластера. На любом файле в среднем пропадает половина кластера. Это утраты в особенности значительны, когда на диске имеется огромное количество малеханьких файлов, а кластер имеет большенный размер. размеры кластеров зависят от размера раздела и типа файловой системы Примерный спектр, в каком может изменяться размер кластера, составляет от 512 б до 10-ов кб.

Очередной метод задания физического расположения файла заключается в ординарном перечислении номеров кластеров, занимаемых сиим файлом (рис. 4, г). Этот список и служит адресом файла. Недочет данного метода очевиден: длина адреса зависит от размера файла и для огромного файла может составить значительную величину. Достоинством же является высочайшая скорость доступа к произвольному кластеру файла, потому что тут применяется ровная адресация, которая исключает просмотр цепочки указателей при поиске адреса случайного кластера файла. Фрагментация на уровне кластеров в этом методе также отсутствует.

Крайний подход с некими модификациями употребляется в обычных файловых системах ОС unix s5 и ufs. Для сокращения размера адресной инфы прямой метод адресации смешивается с косвенным.

В обычной на нынешний денек для unix файловой системе ufs употребляется последующая схема адресации кластеров файла. Для хранения адреса файла выделено 15 полей, каждое из которых состоит из 4 б (рис. 5). Если размер файла меньше либо равен 12 кластерам, то номера этих кластеров конкретно перечисляются в первых 12-ти полях адреса. Если кластер имеет размер 8 Кбайт (наибольший размер кластера, поддерживаемого в ufs), то таковым образом можно адресовать файл размером до 8192×12 = 98 304 б.

Рис. 5. Схема адресации файловой системы ufs

Если размер файла превосходит 12 кластеров, то последующее 13-е поле содержит адресок кластера, в каком могут быть размещены номера последующих кластеров файла. Таковым образом, 13-й элемент адреса употребляется для косвенной адресации. При размере в 8 Кбайт кластер, на который показывает 13-й элемент, может содержать 2048 номеров последующих кластеров данных файла и размер файла может возрасти до 8192*(12+2048)=16 875 520 б.

Если размер файла превосходит 12+2048 = 2060 кластеров, то употребляется 14-е поле, в каком находится номер кластера, содержащего 2048 номеров кластеров, любой из которых хранят 2048 номеров кластеров данных файла. тут применяется уже двойная косвенная адресация. С ее помощью можно адресовать кластеры в файлах, содержащих до 8192*(12+2048+20482
) — 3,43766*1O10
б.

И в конце концов, если файл включает наиболее 12+2048+20482
= 4 196 364 кластеров, то употребляется крайнее 15-е поле для тройной косвенной адресации, что дозволяет задать адресок файла, имеющего последующий наибольший размер:

8192*(12+2048+20482
+20483
)=7,0403*1013
б.

Таковым образом, файловая система ufs при размере кластера в 8 Кбайт поддерживает файлы, состоящие максимум из 70 триллионов б данных, хранящихся в 8 млрд кластеров. Как видно на рис 7.12, для задания адресной инфы о очень большенном файле требуется: 15 частей по 4 б (60 б) в центральной части адреса плюс 1+(1+2048)+(1+2048+20482
) -4198403 кластера в косвенной части адреса. Невзирая на гигантскую величину, это число составляет всего около 0,05 % от размера адресуемых данных.

Файловая система ufs поддерживает дисковые кластеры и наименьших размеров, при всем этом наибольший размер файла будет остальным. Применяемая в наиболее ранешних версиях unix файловая система s5 имеет аналогичную схему адресации, но она рассчитана на файлы наименьших размеров, потому в ней употребляется 13 адресных частей заместо 15.

способ перечисления адресов кластеров файла задействован и в файловой системе NTFS, применяемой в ОС Windows NT/2000. тут он дополнен довольно естественным приемом, сокращающим размер адресной инфы: адресуются не кластеры файла, а непрерывные области, состоящие из смежных кластеров диска. Любая таковая область, именуемая отрезком (run), либо экстентом (extent), описывается при помощи 2-ух чисел: исходного номера кластера и количества кластеров в отрезке. Потому что для сокращения времени операции обмена ОС старается расположить файл в поочередных кластерах диска, то почти всегда количество поочередных областей файла будет меньше количества кластеров файла и размер служебной адресной инфы в NTFS сокращается по сопоставлению со схемой адресации файловых систем ufs/s5.

Для того чтоб корректно принимать решение о выделении файлу набора кластеров, файловая система обязана выслеживать информацию о состоянии всех кластеров диска: волен/занят. Эта информация может храниться как раздельно от адресной инфы файлов, так и совместно с ней.

3. память

Как демонстрируют 1-ые результаты тестирования SSD-дисков разных производителей, преимущество SSD-дисков над классическими HDD-дисками никак не разумеется, в особенности если речь идет о операции выборочной (случайной) записи. Не считая того, до сего времени одним из более слабеньких мест SSD-дисков является количество циклов перезаписи памяти.

Неувязка состоит в том, что инфы. Для того чтоб оценить время жизни (время выработки на отказ) технологии его продления, разглядим простой вариант, когда любой логический сектор случае если нужно обновить содержимое логического сектора, сначало необходимо стереть информацию соответственного физического сектора. Не считая того, во один Physical Erase Unit может содержать несколько физических секторов памяти.

Сейчас разглядим вариант, когда в ОС употребляется файловая система FAT. В этом случае при операциях записи на флэш-память FAT-таблицы будут повсевременно модифицироваться. Неувязка в том, что FAT-таблицы размещаются в строго определенном месте, другими словами постоянно соотносятся с одними и теми же логическими секторами памяти, а как следует, с одними и теми же физическими секторами. Но нередко повторяющиеся операции перезаписи одних и тех же физических секторов жизни всей памяти значительно сокращается.


ИСПОЛЬЗОВАННАЯ ЛИТЕРАТУРА

1. Операционные системы Попов, Партыка

]]>