diff --git a/drupal2spip_lal/base/convert.py b/drupal2spip_lal/base/convert.py index d3e6e8a..e02d420 100644 --- a/drupal2spip_lal/base/convert.py +++ b/drupal2spip_lal/base/convert.py @@ -75,9 +75,10 @@ def fetch_and_remove_logo(article, force_download): for elem in list(img.previous_siblings) + list(img.next_siblings) if elem != '\n' ] - if img.parent.name == 'a' and not has_siblings: - img = img.parent - img.replace_with('') + if img.parent.name in ['a', 'p'] and not has_siblings: + img.parent.replace_with('') + else: + img.replace_with('') soup = bs(article.descriptif, 'html.parser') img = soup.find('img') @@ -91,6 +92,15 @@ def fetch_and_remove_logo(article, force_download): fetch_logo(src) remove_img(img) article.descriptif = str(soup) + + # L'image est généralement reprise dans le corps avec un format + # différent (par ex sans lien vers l'article). + soup = bs(article.texte, 'html.parser') + img = soup.find('img', src=src) + if img: + remove_img(img) + article.texte = str(soup) + article.save()