Outils pour utilisateurs

Outils du site


informatique:awk

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
Prochaine révisionLes deux révisions suivantes
informatique:awk [2019/03/21 08:57] alexisinformatique:awk [2020/11/26 13:35] – [Remplacer le séparateur d'un fichier] alexis
Ligne 1: Ligne 1:
 ====== Awk ====== ====== Awk ======
  
-<WRAP center round todo 60%> +===== Variables =====
-cat var/logs/accounting_prod-2019-03-21.log | awk -F '/' '{print $3}' | sort | uniq -c +
-    440 credit_notes +
-      7 deposits +
-      3 direct_debit_batches +
-    909 incidents +
-  26378 invoices +
-     78 operations +
-  11201 payments +
-    145 refunds +
-     81 safe_deposits+
  
-cat var/logs/accounting_prod-2019-03-21.log | awk -F '/' '{print $3}' | sort | uniq -c | awk '{print $1}' | paste -sd+ - | bc +=== FILENAME — nom du fichier courant === 
-39242+La variable ''FILENAME'' contient le nom du fichier courant. 
 +<code bash> 
 +awk '{print FILENAME}' <fichier> 
 +</code> 
 + 
 +=== FNR — nombre d'enregistrements lus dans le fichier courant === 
 +La variable ''FNR'' contient le nombre d'enregistrements lus dans le fichier courant. 
 +Le compteur d'enregistrements s'initialise entre chaque fichier. 
 +<code bash> 
 +awk '{print FNR}' <fichier1> <fichier2> 
 +</code> 
 + 
 +=== FS — Séparateur de champs === 
 +La variable ''FS'' est utilisée pour changer la valeur du séparateur de champs. 
 +Par défaut, l'espace et la tabulation sont utilisés. 
 +<code bash> 
 +# Initialisation de la variable dans la liste de commande 
 +awk 'BEGIN { FS="=" } { print $1 }' <fichier> 
 + 
 +# Initialisation de la variable par l'option du programme 
 +awk -F'=' '{print $1}' <fichier> 
 +</code> 
 + 
 +<WRAP info> 
 +Le séparateur de champ peut être une expression rationnelle. 
 +<code bash> 
 +# Initialisation de la variable dans la liste de commande 
 +awk 'BEGIN { FS="[=_]"{ print $1 }' <fichier> 
 + 
 +# Initialisation de la variable par l'option du programme 
 +awk -F'[=_]' '{print $1}' <fichier> 
 +</code>
 </WRAP> </WRAP>
  
  
-===== Variables ===== +=== NF — Nombre de champs === 
-  NR nombre d'enregistrements lus +La variable ''NF'' contient le nombre de champs de l'enregistrement courant. 
-  * FNR : nombre d'enregistrements lus dans le fichier courant +<code bash> 
-  * FILENAME : nom du fichier courant +awk '{print NF}' <fichier> 
-  * FS : séparateur de champs en entrée +</code> 
-  OFS séparateur de champs en sortie+ 
 +=== NR — Nombre d'enregistrements lus === 
 +La variable ''NR'' contient le nombre total d'enregistrements lus. 
 +Le compteur d'enregistrements ne s'initialise pas entre chaque fichier. 
 +<code bash> 
 +awk '{print NR}' <fichier1> <fichier2> 
 +</code> 
 + 
 +=== OFS — Séparateur de champs de la sortie === 
 +La variable ''OFS'' est utilisée pour changer la valeur du séparateur de champs de la sortie
 +Par défaut, l'espace est utilisée. 
 +<code bash> 
 +awk 'BEGIN { OFS=":" } { print $1 }' <fichier> 
 +</code>
  
 ===== Scripts ===== ===== Scripts =====
Ligne 74: Ligne 108:
 # Syntaxe alternative # Syntaxe alternative
 awk '(NR%3){print $0}' awk '(NR%3){print $0}'
 +</code>
 +
 +==== Faire des statistiques d'appels ====
 +
 +Dans le journal des évènements d'une API contenant la liste des URI appelées, je veux compter les types d'appels en sachant que l'anatomie d'une URI est la suivante : ''/xxx/type/id''
 +<code bash>
 +# trouver le nombre d'appels par type
 +cat /chemin/du/fichier/de.log | awk -F '/' '{print $3}' | sort | uniq -c
 +
 +# Résultat obtenu
 +    440 credit_notes
 +      7 deposits
 +      3 direct_debit_batches
 +    909 incidents
 +  26378 invoices
 +     78 operations
 +  11201 payments
 +    145 refunds
 +     81 safe_deposits
 +
 +# Trouver le nombre d'appels en utilisant la même syntaxe que précédemment
 +cat /chemin/du/fichier/de.log | awk -F '/' '{print $3}' | sort | uniq -c | awk '{print $1}' | paste -sd+ - | bc
 +# Mais c'est beaucoup plus simple d'utiliser un autre outil
 +wc -l /chemin/du/fichier/de.log
 +
 +# Résultat obtenu
 +39242
 +</code>
 +
 +==== Afficher le dernier champ de chaque ligne ====
 +En faisant astucieusement usage de la variable ''NF'' ((Astuce trouvée sur [[https://unix.stackexchange.com/questions/145672/print-last-element-of-each-row/145673#145673|Unix & Linux Stack Exchange]]
 +))
 +<code bash>
 +awk '{print $NF}' <fichier>
 +</code>
 +
 +==== Remplacer le séparateur d'un fichier ====
 +En assignant la variable ''$1'' à ''$1'', cela modifie la valeur du champ ce qui force ''awk'' à reconstruire l'enregistrement ''$0''.
 +La reconstruction de l'enregistrement remplace le séparateur ''FS'' par ''OFS''.
 +<code bash>
 +# Ici, 1 équivaut à true, ce qui affiche la ligne complète
 +awk 'BEGIN { FS=","; OFS="|" } { $1=$1 } 1' <fichier>
 +
 +# Cette écriture est donc équivalente
 +awk 'BEGIN { FS=","; OFS="|" } { $1=$1; print $0 }' <fichier>
 </code> </code>
  
informatique/awk.txt · Dernière modification : 2023/01/04 20:46 de alexis