Особенности импорта текстовых файлов
Текстовые файлы являются одним из самых универсальных способов хранения и передачи данных. Большинство текстовых редакторов позволяют сохранять данные в формате простого текста, что делает их удобными для импорта в Microsoft Access 2002.
Например, в Microsoft Word 2002 можно просто открыть документ и сохранить его в виде текстового файла, выбрав команду Файл → Сохранить как (File → Save As).
Выбор формата текстового файла
Если у вас есть возможность выбора формата текстового файла перед импортом, рекомендуется использовать файлы с разделителями (Delimited). Они обеспечивают более компактное хранение данных и упрощают обработку.
Недостатки файлов с фиксированной шириной полей:
- Они занимают больше места из-за множества пробелов.
- Access 2002 анализирует только первые 20 строк при определении границ полей, что может привести к неверной автоматической разметке.
- Внесение изменений в структуру данных может привести к проблемам с разметкой полей.
Использование символов-разделителей
В текстовых файлах могут использоваться различные символы для разделения полей. Стандартными разделителями считаются:
- Запятая (
,
) – стандартный символ для файлов CSV. - Символ табуляции (
\t
) – часто используется в файлах TSV. - Точка с запятой (
;
) – применяется в европейских странах. - Пробел – редко используется, так как может присутствовать в самих данных.
Access 2002 поддерживает работу со всеми этими стандартными символами и позволяет задать собственный разделитель, если импортируемый файл использует нестандартное разделение полей.
Использование кавычек для текстовых данных
Многие текстовые файлы используют кавычки для выделения текстовых значений, чтобы отличить их от числовых. Access 2002 автоматически определяет, какие поля являются текстовыми, если они заключены в кавычки.
Замечание
Не все приложения экспортируют текстовые поля в кавычках. Например, Microsoft Excel при сохранении данных в формате CSV не заключает текстовые значения в кавычки.
Рис. 3.24. Текстовый файл в формате CSV открыт в приложении "Блокнот"
Определение типа текстового файла
Чтобы определить формат текстового файла перед импортом, можно воспользоваться стандартными текстовыми редакторами:
- Блокнот (Notepad) – удобен для небольших файлов (до 60 КБ).
- WordPad – поддерживает большие текстовые файлы, но не рекомендуется сохранять файлы в формате DOC.
Импорт текстовых файлов формата SDF
Формат SDF (Standard Data Format) широко используется в базах данных. В файлах этого типа все текстовые значения заключаются в кавычки, а числовые и даты – нет.
Рис. 3.25. Текстовый файл в формате SDF открыт в приложении "Блокнот"
Использование табуляции как разделителя
Некоторые текстовые процессоры используют символ табуляции для разделения данных. Он также применяется при преобразовании текста в таблицу. Однако в этом случае текстовые значения редко выделяются кавычками, что может вызывать ошибки при импорте.
Замечание
При экспорте данных в текстовые файлы Access 2002 автоматически заключает текстовые значения в кавычки, если разделителем выступает табуляция. Это предотвращает ошибочное восприятие символов новой строки как разделителей записей.
Тем не менее, рекомендуется избегать использования символов новой строки внутри текстовых полей, так как это может затруднить импорт данных.