Работа с Html

Тема в разделе "Java", создана пользователем telecom, 14 окт 2010.

Статус темы:
Закрыта.
  1. telecom

    telecom Гость

    Доброго времени суток.
    У меня возник такой вопрос, извиняюсь, если не та ветка.

    Необходимо прочитать htm файл большого размера (примерно 18mb), т.е. его контент. В этом контенте таблица с кучей строк, так вот необходимо их прочитать, т.е. извлечь данные, а именно заголовок таблицы(названия столбцов) и соответственно данные из строк ....

    т.е. возможно, все эти данные "прочитать" либо в таблицу БД или Excel..

    Подскажите, пожалуйста, как мне поступить, как это реализовать?

    Вот мой код HTML:

    <!--Generated by CBOSSrep Report System for report AB-->
    <html>
    <META http-equiv="Content-Type" content="text/html; charset=utf-8">
    <head>
    <style> .st1 {border:0pt solid; border-bottom-color:black; border-color:black; border-left-color:black; border-right-color:black; border-top-color:black; color:black; font:normal 400 10pt 'Times New Roman',serif; text-align:left; vertical-align:top; white-space:normal; width:100%}
    .st2 {border-color:black; border-style:solid; border-width:2pt 0pt 1pt; color:black; font:normal 700 14pt 'Arial',sans-serif; margin-bottom:2mm; overflow:hidden; padding:1mm 0mm; text-align:left; vertical-align:top; white-space:normal; width:100%}
    .st3 {border-color:black; border-style:solid; border-width:0pt 0pt 2pt; color:black; font:italic 700 12pt 'Arial',sans-serif; overflow:hidden; padding-bottom:1mm; text-align:right; vertical-align:top; white-space:normal; width:100%}
    .st4 {border:1pt solid black; color:black; font:normal 400 10pt 'Times New Roman',serif; margin-top:2mm; overflow:hidden; text-align:left; vertical-align:top; white-space:normal; width:100%}
    .st5 {background-color:#D4D4D4; border:1pt solid black; color:black; font:normal 700 11pt 'Arial',sans-serif; overflow:hidden; text-align:left; vertical-align:top; white-space:normal}
    .st6 {background-color:#D4D4D4; border:1pt solid black; color:black; font:normal 700 11pt 'Arial',sans-serif; overflow:hidden; text-align:right; vertical-align:top; white-space:normal}
    .st7 {background-color:#D4D4D4; border:1pt solid black; color:black; font:normal 700 11pt 'Arial',sans-serif; overflow:hidden; text-align:center; vertical-align:top; white-space:normal}
    .st8 {border:1pt solid black; color:black; font:normal 400 10pt 'Times New Roman',serif; overflow:hidden; text-align:left; vertical-align:top; white-space:normal}
    .st9 {border:1pt solid black; color:black; font:normal 400 10pt 'Times New Roman',serif; overflow:hidden; text-align:right; vertical-align:top; white-space:normal}
    .st10 {border:1pt solid black; color:black; font:normal 400 10pt 'Times New Roman',serif; overflow:hidden; text-align:center; vertical-align:top; white-space:normal}

    A{COLOR: #090; TEXT-DECORATION: none}
    BR { line-height:0.2em; }
    TABLE { border: none; width:100%}
    HEAD, BODY, TH, TR, TD { border: none; word-wrap: break-word;}
    </style>
    </head><body style="width:99%" class="st1">
    <DIV class="st2">Абоненты в блокировке</DIV>
    <DIV class="st3">Внешний вид: Основной;<BR></BR>Фин. регион: 1500 - Гродно ЦПУ, 1501 - Гродно РУЭС, 1511 - Берестовица, 1512 - Волковыск, 1513 - Свислочь, 1514 - Щучин, 1515 - Мосты и другие ...;<BR></BR>Тарифный план: все;<BR></BR>Юр. статус абонента: все;<BR></BR>Метод расчетов: все;<BR></BR>Тип блокировки: принудительная, 3 Комб:принудительная+добровольная, 10 Комб:заключительная+принудительная, 11 Комб:заключительная+принудительная+добровольная, 18 Комб:частичная+принудительная, 19 Комб:частичная+принудительная+добровольная, 26 Комб:частичная+заключительная+принудительная и другие ...;<BR></BR>Биллинговая группа: Контрактные абоненты.</DIV>

    <DIV class="st4">
    <TABLE cellspacing="0" cellpadding="0" style="border-collapse:collapse;table-layout:fixed;" height="1px">
    <COLGROUP>
    <COL width="8%"></COL>
    <COL width="8%"></COL>
    <COL width="8%"></COL>
    <COL width="8%"></COL>
    <COL width="8%"></COL>
    <COL width="8%"></COL>
    <COL width="8%"></COL>
    <COL width="8%"></COL>
    <COL width="8%"></COL>
    <COL width="8%"></COL>
    <COL width="8%"></COL>
    <COL width="12%"></COL>
    </COLGROUP>
    <TBODY>

    <TR>
    <TD class="st5">Фин. регион</TD>
    <TD class="st5">Тарифный план</TD>
    <TD class="st5">Метод расчетов</TD>
    <TD class="st5">Юр. статус абонента</TD>
    <TD class="st6">Лицевой счет</TD>
    <TD class="st5">Номер договора</TD>
    <TD class="st5">Внешний код</TD>
    <TD class="st7">Дата активации</TD>

    <TD class="st5">ФИО/Организация</TD>
    <TD class="st5">Тип блокировки</TD>
    <TD class="st7">Дата блокировки</TD>
    <TD class="st6">Баланс л/с</TD>
    </TR>
    <TR>
    <TD class="st8">1500 - Гродно ЦПУ</TD>
    <TD class="st8">Базовый</TD>
    <TD class="st8">Авансовый</TD>
    <TD class="st8">организация</TD>

    <TD class="st9">21296</TD>
    <TD class="st8">1500-0001305-08</TD>
    <TD class="st8">80342</TD>
    <TD class="st10">27-07-2007 11:56:25</TD>
    <TD class="st8">ООО "БРМ продукт"</TD>
    <TD class="st8">34 Комб:техническая+принудительная</TD>
    <TD class="st10">02-09-2010 12:37:27</TD>
    <TD class="st9">-4000.00</TD>
    </TR>

    <TR>
    <TD class="st8">1500 - Гродно ЦПУ</TD>
    <TD class="st8">Базовый</TD>
    <TD class="st8">Авансовый</TD>
    <TD class="st8">организация</TD>
    <TD class="st9">59502</TD>
    <TD class="st8">1500-0003557-08</TD>
    <TD class="st8">80619</TD>
    <TD class="st10">18-03-2008 10:35:40</TD>

    <TD class="st8">ООО "Лигардо"</TD>
    <TD class="st8">принудительная</TD>
    <TD class="st10">18-06-2010 20:35:44</TD>
    <TD class="st9">-3999.99</TD>
    </TR>
    ...............
    ............
    .................
    </TR>
    </TBODY>
    </TABLE>
    </DIV>
    </body></html>


    И как мне из таблицы вытянуть данные?
     
Загрузка...
Статус темы:
Закрыта.

Поделиться этой страницей