EXTRACT

Параметр iMacros EXTRACT

Параметр EXTRACT является частью команды TAG. Основной функцией данного параметра является извлечение данных из сайта. Используйте атрибут ATTR для определения той части, которую необходимо извлечь. Обычно эта часть генерируется с помощью мастера извлечения (Extraction Wizard). Параметр EXTRACT ищет исходный HTML код веб-сайта для н-го появления ATTR и извлекает его. ATTR всегда должен заканчиваться шаблонизатором (*).

Если несколько команд с EXTRACT выполняются в одном макросе, то результаты отделяются друг от друга строкой «[EXTRACT]». При сохранении извлеченных данных («SAVEAS TYPE=EXTRACT») эта строка автоматически заменяется на перевод на новую строку.

Если извлекается таблица целеком, то соседние ячейки таблиц отделяются друг от друга строкой «#NEXT#», а строки таблицы разделяются строкой «#NEWLINE#». Эти спец-теги автоматически заменяются запятой и переводом строки соответственно, когда вы используете команду «SAVEAS TYPE=EXTRACT», но разделители сохраняются при возврате данных в скрипт через вызов функции iimGetLastExtract(). Если извлекаемая таблица содержит вложенные таблицы, то данные внутренней таблицы также будут разделены «#NEXT#» и «#NEWLINE#» .

Работает в:

Синтаксис:

TAG ... EXTRACT=значение

Значение параметра EXTRACT команды TAG:

  • TXT

    • Обычное извлечение текста, содержит все внутренние HTML-теги, если они есть.

    • При использовании раскрывающегося (drop-down) списка (выберите элемент), извлекается выбранная (видимая) запись.

  • TXTALL

    • Для использования с раскрывающимся списком (выберите элемент), извлекаются все записи из списка.

  • HTM

    • Извлекается HTML-код выбранного элемента. Примечание: В iMacros Browser и IE HTML-теги всегда возвращаются в верхнем регистре. Таким образом, «<b>Тест</b>» извлекается как «<B>Тест</B>».

  • HREF

    • URL-ссылка выбранного элемента.

  • ALT

    • Альтернативный текст выбранного изображения.

  • TITLE

    • Title атрибут элемента, например текст всплывающей подсказки.

  • CHECKED

    • Состояние флажка (checkbox) или радиокнопки (radiobutton). Возвращает «true», когда флажок установлен, в противном случае «false».

Примечание: при извлечении текста из поля ввода (команда TAG содержит «TYPE=INPUT»), не должно быть параметра CONTENT.

Извлечение нестандартных атрибутов:

В новых версиях iMacros for Firefox и iMacros Browser, вы можете извлечь любой атрибут. Если вы хотите знать, какие атрибуты доступны, записывайте команду TAG в экспертном режиме.

Примеры:

Как правило, всплывающие подсказки определяется атрибутом TITLE элемента. Вы можете извлечь содержимое всплывающей подсказки с помощью EXTRACT iMacros:

TAG POS=3 TYPE=TD ATTR=TXT:* EXTRACT=TITLE

qTip подсказка в JavaScript фреймворке JQuery используется не стандартный «title», а дополнительный атрибут с названием «data-qtip»:

TAG POS=1 TYPE=TD ATTR=data-qtip:ComputerName=* EXTRACT=data-qtip

ComputerName=* — начальная неизменная часть подсказки и используется для определения всплывающей подсказки которая должна быть извлечена. Запись в Expert Mode создаст команду TAG, которая состоит из всех атрибутов щелкнутого (выбранного) HTML-элемента.