Considering the php below:
<?php
require_once 'gerarxml.php';
/*O gerarxml.php foi uma valiosa contribuição do amigo Guilherme Nascimento:
https://pt.stackoverflow.com/questions/240387/gerar-xml-automaticamente/240392?noredirect=1#comment496556_240392 */
$id=$_GET['id'];
if($id==1){
//Categorias
GerarXml('IG', '#href="(?P<link>.*?ig\.com\.br\/)" title="(?P<title>.*?)">#', file_get_contents('http://ig.com.br'),); // nome do site, regex, file_get_contents
} // A sugestão de usar (?P<link>.*?), em https://pt.stackoverflow.com/questions/242663/php-file-get-contents-follow-url/242671?noredirect=1#comment497755_242671, dada pelo amigo FernandoVR, foi importante para dar robustez a função gerarxml.php (porque não importa a ordem dos elementos)
//Subcategorias
else if($id==2)
GerarXml('IG', '#href="(?P<link>.*?)" title="(?P<title>.*?)".*image" src=(?P<logo>.*?)"#', file_get_contents('o que vai aqui??'),); // nome do site, regex, file_get_contents
// aqui também há a questão das páginas seguintes (aceito sugestões)
else if($id==3){
GerarXml('IG',re, file_get_contents('o que vai aqui??');
}
?>
I need to capture 3 variable elements of id1 to use in id2 and id2 of id2 for id3 ( $title
, $logo
(when it exists) and $link
)
That is: id1 => id2 => id3 (id1 id page, id2 id2 splitting, id3 id2 splitting)
A complication, I believe, is that these elements (title, logo, and url) are generated in the gerarxml.php
function using preg_match_all
and foreach
(linked to $data[1] as $key => $value
)
In id1 I literally set the url to require_once
' link '; but in id2 and id3 I need to use the variable file_get_contents
;
I tested it with another schema (without using $url
) and using require_once
. But id2 only captured the contents of the homepage (not followed for its respective deployment), as well as capturing equal content for all categories (id1)