Outils pour utilisateurs

Outils du site


informatique:anatomie_des_flux_de_reddit

Anatomie des flux de Reddit

Ici, on ne va pas parler du format du flux car il est standard mais du contenu de la balise content de chaque entrée du flux. Le contenu de cette balise est normalisé mais il existe plusieurs variantes. Certains éléments sont communs à toutes ces variantes. Il s'agit des méta-données (lien vers la page de l'auteur du message, lien vers le message original et lien vers les commentaires du message original) et du contenu du message (texte et/ou image).

Description des variantes

Cas n°1 : texte uniquement

<!-- SC_OFF --><div class="md"><p>I am relatively new to quilting, but have always been a Journaler. I was wondering how others go about documenting / journaling their quilts? I have had a look on Pinterest for some inspirational and am off to a good start but just thought i&#39;d ask here to see if anyone has a unique / interesting way of doing so? What sort of things do you record? How do you do so? Do you have a &#39;swatch library&#39;. Any input is highly appreciated!</p> </div><!-- SC_ON --> &#32; submitted by &#32; <a href="https://www.reddit.com/user/Sweetfruit19"> /u/Sweetfruit19 </a> <br/> <span><a href="https://www.reddit.com/r/quilting/comments/x7nuus/does_anyone_keep_a_journal_of_their_quilts/">[link]</a></span> &#32; <span><a href="https://www.reddit.com/r/quilting/comments/x7nuus/does_anyone_keep_a_journal_of_their_quilts/">[comments]</a></span>

Ici, on remarque que :

  1. Le contenu textuel se situe dans une balise div ayant md comme classe CSS.
  2. L'absence de balise table ainsi que de ses enfants naturels.
  3. La présence des commentaires SC_OFF et SC_ON autour du contenu textuel. 1)

Cas n°2 : image uniquement

<table> <tr><td> <a href="https://www.reddit.com/r/quilting/comments/x7r8nw/1st_attempt_dont_love_this_layout_but_these_are/"> <img src="https://preview.redd.it/sagxygwc5cm91.jpg?width=640&amp;crop=smart&amp;auto=webp&amp;s=3967965a78f33225f206ae9429a1eb0de53eb1be" alt="1st attempt! don't love this layout but these are my colors so far" title="1st attempt! don't love this layout but these are my colors so far" /> </a> </td><td> &#32; submitted by &#32; <a href="https://www.reddit.com/user/MarvellouslyChaotic"> /u/MarvellouslyChaotic </a> <br/> <span><a href="https://i.redd.it/sagxygwc5cm91.jpg">[link]</a></span> &#32; <span><a href="https://www.reddit.com/r/quilting/comments/x7r8nw/1st_attempt_dont_love_this_layout_but_these_are/">[comments]</a></span> </td></tr></table>

Ici, on remarque que :

  1. L'ensemble du contenu se situe dans une balise table.
  2. La première cellule du tableau contient une image miniature.
  3. La seconde cellule du tableau contient les méta-données.

Cas n°3 : texte et image

<table> <tr><td> <a href="https://www.reddit.com/r/quilting/comments/x7qree/update_on_bernina_20quilting_setup/"> <img src="https://preview.redd.it/lb9p8olb1cm91.jpg?width=640&amp;crop=smart&amp;auto=webp&amp;s=81d82f1dc4c5062b97073d9f4ad8c33e75705c07" alt="Update on Bernina 20/Quilting Set-up!" title="Update on Bernina 20/Quilting Set-up!" /> </a> </td><td> <!-- SC_OFF --><div class="md"><p>Hello and a very big thank you to those who responded to my previous plea/post asking for help. (I was struggling with the weight of my sandwich pulling and distorting my stitching lines while quilting.) Some recommended a suspension system which was a real lightbulb moment for me. </p> <p>Took 2 weeks, more effort than it likely should have, and cost 3x as much as any commercial product (😂), but here it is. </p> <p>Is it perfect? No way. But I’m tickled pink. Thx again for all the help and support!!!</p> </div><!-- SC_ON --> &#32; submitted by &#32; <a href="https://www.reddit.com/user/linnaksea"> /u/linnaksea </a> <br/> <span><a href="https://i.redd.it/lb9p8olb1cm91.jpg">[link]</a></span> &#32; <span><a href="https://www.reddit.com/r/quilting/comments/x7qree/update_on_bernina_20quilting_setup/">[comments]</a></span> </td></tr></table>

Ici, on remarque que :

  1. Le contenu textuel se situe dans une balise div ayant md comme classe CSS.
  2. La présence des commentaires SC_OFF et SC_ON autour du contenu textuel. 2)
  3. L'ensemble du contenu se situe dans une balise table.
  4. La première cellule du tableau contient une image miniature ainsi que le contenu textuel.
  5. La seconde cellule du tableau contient les méta-données.

Extraction des informations

  • Contenu textuel – Contenu du div ayant md pour classe CSS.
  • Lien vers la page de l'auteur – Premier lien suivant le mot submitted.
  • Lien vers le message – Second lien suivant le mot submitted, sa valeur affichée est [link].
  • Lien vers les commentaires associés au message – Troisième lien suivant le mot submitted, sa valeur affichée est [comments].
1) , 2)
SC ou Spaces Compression
informatique/anatomie_des_flux_de_reddit.txt · Dernière modification : 2022/09/10 10:15 de alexis