FacebookTwitter

Γιατί είναι πολύ κακά να δημοσιεύσετε ένα επιστημονικό περιοδικό μόνο σε PDF; (Μέρος 2)

The Atlantic δημοσίευσε ένα άρθρο με τον τίτλο “Η επιστημονική δημοσίευση είναι ξεπερασμένη” που είναι εικονογραφημένο με το φλεγομένο χειρόγραφο. Ο παρακάτω υπότιτλος είναι λίγο καθησυχαστικός – “Εδώ είναι το επόμενο.”

Τι θα ακολουθήσει; Που πάμε; Το άρθρο, που γράφτηκε από τον πρώην συντάκτη του The Atlantic, James Somers, δεν σηματοδοτεί το θάνατο μιας επιστημονικής έκδοσης, όπως υποδηλώνει γρήγορα ο τίτλος. Προτείνει ότι η έρευνα που βασίζεται σε χαρτί καθίσταται ξεπερασμένη. Ο Somers υποστηρίζει ότι η εκτύπωση περιοδικών και η δημοσίευση άρθρων PDF σε χαρτί στο Διαδίκτυο δεν επιτρέπει τη δυναμική παρουσίαση της έρευνας που απαιτείται για συγγραφείς και αναγνώστες. Κάνει την ερώτηση: “Τι θα έχετε αν δημιουργήσετε ένα επιστημονικό άρθρο από το μηδέν σήμερα;” Το άρθρο ασχολείται με μια εναλλακτική έκδοση μιας επιστημονικής έκδοσης, που δημιουργήθηκε χρησιμοποιώντας τη λεγόμενη υπολογιστική μορφή του computational notebook.

Το αν το computational notebook θα γίνει η κύρια μορφή έκδοσης δεν έχει ακόμη καθοριστεί. Όπως σημειώνει ο Somers, αυτό θα απαιτήσει δραματικές αλλαγές στην ακαδημαϊκή έρευνα και το εκδοτικό περιβάλλον γενικά. Και είναι το PDF τόσο παλιό; Συζητήσαμε τους περιορισμούς των αρχείων PDF στο πρώτο μέρος αυτού του άρθρου. Η μορφή PDF δεν υποστηρίζει αρχεία πολυμέσων και τέτοιο περιεχόμενο είναι πολύ δύσκολο να διαβαστεί κανείς από την οθόνη των κινητών συσκευών. Αλλά τα PDF έχουν τα πλεονεκτήματά τους. Τα αρχεία PDF είναι η καλύτερη μορφή για επιστήμονες που προτιμούν να διαβάζουν φυσικά αντίγραφα άρθρων, καθώς αυτή η μορφή τους επιτρέπει να εκτυπώνουν το υλικό που θέλουν και να είναι σίγουροι ότι το αντίγραφο θα είναι πανομοιότυπο με το πρωτότυπο. Τα αρχεία PDF μπορούν επίσης να αποθηκευτούν σε μορφή e-book, καθιστώντας τα εύκολα στη μεταφορά. Υπάρχουν λοιπόν λόγοι να μην ξεγράφει κανείς από τη λίστα τα αρχεία PDF.

Ωστόσο, αφήνοντας κατά μέρος τη συζήτηση σχετικά με τη χρησιμότητα των αρχείων PDF, καθίσταται σαφές ότι η χρήση της διαδικτυακής μορφής εκδόσεων με βάση το χαρτί δεν παρέχει την καλύτερη δυνατή εμπειρία χρήστη για αναγνώστες ανθρώπων ή για έναν αυξανόμενο αριθμό αναγνωστών μηχανών (μηχανές αναζήτησης, αποθετήρια, αθροιστές κ.λπ.). Τα μηχανήματα πρέπει να είναι σε θέση να επεξεργάζονται πληροφορίες σε γλώσσες σήμανσης υπολογιστή και οι επιστήμονες πρέπει να είναι σε θέση να προσθέτουν δυναμικά στοιχεία σε έγγραφα, να αναλύουν δεδομένα και να διαβάζουν απλά άρθρα στις κινητές συσκευές τους χωρίς να διαμαρτύρονται για ταλαιπωρία.

Οι αλλαγές που εισάγονται σε περιοδικά σε διάφορους κλάδους που μπορούν να βελτιώσουν σημαντικά τη διαδικτυακή διαθεσιμότητα και χρησιμότητα των επιστημονικών δημοσιεύσεων είναι η δημοσίευση άρθρων σε HTML και πλήρες κείμενο XML. Η δημιουργία αυτών των πρόσθετων μορφών άρθρου δεν απαιτεί απαραίτητα πρόσθετα στάδια παραγωγής. Χρησιμοποιώντας τις διαδικασίες ψηφιακής πληκτρολόγησης, τα περιοδικά μπορούν να δημιουρούν ταυτόχρονα πολλά αρχεία άρθρων. Πως το σύστημα Hephaestus, που αναπτύχθηκε από το RADS, σας επιτρέπει να επισημάνετε επιστημονικά άρθρα για προσθήκη σε διάφορα αποθετήρια, μπορείτε να το βρείτε εδώ.

Γιατί χρειάζονται άλλοι τύποι αρχείων εκτός από το PDF;

Η αναζήτηση είναι ο ακρογωνιαίος λίθος της επιστημονικής έρευνας

Ας αναλύσουμε πρώτα ένα από τα μεγαλύτερα προβλήματα με τη δημοσίευση σε PDF – το περιορισμένο περιεχόμενο αναζήτησης. Στις ψηφιακές εκδόσεις, η αναζήτηση είναι το θεμέλιο των πάντων, ο ακρογωνιαίος λίθος της επιστημονικής γνώσης. Η έκθεση του Renew Publishing Consultants ‘2018 που ονομάζεται «How Readers Discovered Content in Scientific Publications» αναφέρει ότι «οι ακαδημαϊκοί ερευνητές (ομάδα χωρίς μαθητές) κατατάσσουν τις μηχανές αναζήτησης ως τον πιο σημαντικό πόρο για την εύρεση επιστημονικών άρθρων». Η αναφορά περιλαμβάνει επιστημονικές βάσεις δεδομένων (π.χ. το PubMed Central), καθώς και πιο γενικές μηχανές επιστημονικής αναζήτησης όπως το Google Scholar.

Υπάρχουν δύο κύρια μοντέλα για το πώς τα αποθετήρια και οι μηχανές αναζήτησης συλλέγουν και επεξεργάζονται πληροφορίες για να μάθουν τι να επιστρέψουν στα αποτελέσματα αναζήτησης: (1) τα μεταδεδομένα και καταθέσεις περιεχομένου και (2) οι ανιχνευτές. Και στα δύο αυτά σενάρια, το PDF δεν συμμορφώνεται με τα πρότυπα. Σε περίπτωση ενσωμάτωσης μεταδεδομένων και αποθήκευσης περιεχομένου, τα αρχεία PDF δεν είναι αναγνώσιμα από υπολογιστή. Οι περισσότερες βάσεις δεδομένων απαιτούν μεταβίβαση μεταδεδομένων και περιεχομένου σε αυτές σε XML συμβατό με το JATS. Τα περιοδικά που δεν δημιουργούν αρχεία XML με δυνατότητα ανάγνωσης από μηχανή μπορούν να εισάγουν μη αυτόματα δεδομένα σε ορισμένα ευρετήρια, αλλά αυτή είναι μια κουραστική διαδικασία που δεν επιτρέπει όλες τις πληροφορίες που απαιτούνται για την αποτελεσματική επεξεργασία των δεδομένων.

Στην περίπτωση μηχανών αναζήτησης που βασίζονται σε προγράμματα ανίχνευσης μηχανών αναζήτησης, τα αρχεία PDF είναι επίσης το πρόβλημα. Αν και μπορούν να ευρετηριαστούν από πολλές μηχανές αναζήτησης, το περιεχόμενό τους δεν βελτιστοποιείται για αναζήτηση για διάφορους λόγους. Πρώτον, τα άρθρα PDF συχνά δεν διαθέτουν επαρκή μεταδεδομένα HTML επειδή πολλά περιοδικά δεν τα τοποθετούν σε σελίδες ιστότοπου αλλά συνδέονται απευθείας με το ίδιο το PDF. Για να ευρετηριάσουν αποτελεσματικά τους ιστότοπους περιοδικών, τα προγράμματα ανίχνευσης πρέπει να είναι σε θέση να βρουν κάθε άρθρο περιοδικού σε ξεχωριστή ιστοσελίδα με τα μεταδεδομένα άρθρου σε επίπεδο HTML που σχετίζονται με αυτό. Τα αρχεία PDF από μόνα τους δεν παρέχουν στους σαρωτές τα μεταδεδομένα που χρειάζονται.

Για τη βελτιστοποίηση άρθρων για μηχανές αναζήτησης, τα περιοδικά πρέπει να δημοσιεύουν κάθε ένα από τα άρθρα τους σε μια συγκεκριμένη ιστοσελίδα άρθρου που περιλαμβάνει τα βιβλιογραφικά μεταδεδομένα σε επίπεδο HTML. Αυτή είναι στην πραγματικότητα μια βασική απαίτηση για την εγγραφή των περιοδικών στο Google Scholar. Τα περιοδικά μπορούν να εκπληρώσουν αυτήν την απαίτηση έχοντας ξεχωριστές ιστοσελίδες για εκδόσεις PDF κάθε άρθρου, ιδανικά χρησιμοποιώντας ένα ενσωματωμένο πρόγραμμα προβολής PDF στην ιστοσελίδα, αντί να συνδέονται οι σελίδες άρθρων με αρχεία PDF. Η εμφάνιση άρθρων PDF σε ιστοσελίδες βοηθά τις μηχανές αναζήτησης να «κατανοήσουν» πώς σχετίζονται με άλλο περιεχόμενο στον ιστότοπο και αυξάνει την πιθανότητα ανίχνευσης πρόσθετων σελίδων.

Ωστόσο, ακόμη και όταν τοποθετούνται σε ξεχωριστές ιστοσελίδες, τα αρχεία PDF ενδέχεται να περιέχουν περιορισμούς συνδέσμων. Μπορεί να είναι κουραστικό να προσθέσετε συνδέσμους με δυνατότητα κλικ στα αρχεία PDF, ενώ το HTML είναι πιο βολικό για την προσθήκη συνδέσμων με δυνατότητα κλικ σε κείμενο. Τα άρθρα HTML βελτιώνουν επίσης την εμπειρία χρήστη όσον αφορά συνδέσμους. Επιτρέπουν στους χρήστες να ανοίγουν συνδέσμους σε ξεχωριστές καρτέλες διατηρώντας παράλληλα τον χώρο ανάγνωσής τους στο άρθρο. Τα αρχεία PDF συχνά ανοίγουν συνδέσμους σε μία καρτέλα, με αποτέλεσμα ο αναγνώστης να μεταβεί σε άλλη σελίδα και να χάσει τη θέση που διάβαζε πριν.

Ο επόμενος, αλλά όχι λιγότερο σοβαρός περιορισμός των αρχείων PDF στη σύγχρονη αναζήτηση είναι η έλλειψη ανταπόκρισης για φορητές συσκευές. Σήμερα, πολλές μηχανές αναζήτησης, συμπεριλαμβανομένης της Google, μετακινούνται στην ευρετηρίαση από κινητές συσκευές. Το πρόγραμμα ανίχνευσης ευρετηριάζει και κατατάσσει περιεχόμενο φιλικό προς κινητά σε σχέση με περιεχόμενο που δεν είναι κατάλληλο για κινητά. Επομένως, η βελτιστοποίηση της έκδοσης για ανάγνωση από κινητές συσκευές είναι το κλειδί για την ανταγωνιστικότητά της.

Οι αναγνώστες γίνονται πιο κινητοί

Εκτός από την αναζήτηση, υπάρχουν επίσης τα σαφή οφέλη για τους αναγνώστες όταν γράφουν άρθρα σε HTML φιλικό προς κινητά. Καθώς η χρήση κινητής τηλεφωνίας αυξάνεται στο ευρύ κοινό, αυξάνεται επίσης στον ακαδημαϊκό χώρο. Η έκθεση του 2015 «Πως οι αναγνώστες βρίσκουν περιεχόμενο σε επιστημονικές δημοσιεύσεις» διαπίστωσε ότι οι ερευνητές συνεχίζουν να χρησιμοποιούν κυρίως επιτραπέζιους και φορητούς υπολογιστές για έρευνα και συγγραφή, αλλά υπήρξε μια σαφής αύξηση στη χρήση κινητών συσκευών από ερωτηθέντες σε διάφορους κλάδους. … Αυτό ισχύει ιδιαίτερα σε χώρες χαμηλού εισοδήματος, όπου ο αριθμός των χρηστών κινητών συσκευών έχει σχεδόν διπλασιαστεί. Καθώς ολόκληρος ο κόσμος γίνεται πιο κινητός, οι επιστήμονες πρέπει να έχουν πρόσβαση στην έρευνα γρήγορα και εύκολα. Και για χώρες χαμηλού εισοδήματος, οι κινητές συσκευές είναι συχνά πιο προσιτές από τους υπολογιστές.

Οι ευκαιρίες για βελτίωση της εμπειρίας ανάγνωσης και της χρήσης

Η δημοσίευση των αρχείων PDF από μόνη της περιορίζει τη χρήση νέων εμπειριών ανάγνωσης και άρθρων στο Διαδίκτυο. Για παράδειγμα, οι ορισμένοι εκδότες και βάσεις δεδομένων περιεχομένου αρχίζουν να εισάγουν μεταδεδομένα εμπλουτισμένων άρθρων. Τα εμπλουτισμένα μεταδεδομένα περιλαμβάνουν στοιχεία σημασιολογικού περιεχομένου που μπορούν να βοηθήσουν τις βάσεις δεδομένων όχι μόνο να καταλάβουν ποιο είναι το περιεχόμενο, αλλά και τι αφορά. Σε μια πρόσφατη συνέντευξή του, ο Jabin White, αντιπρόεδρος της διαχείρισης περιεχομένου στο JSTOR και στο Portico, έδωσε μια υπέροχη ομιλία για πλούσια μεταδεδομένα. Όπως σημείωσε, η ύπαρξη πλήρους κειμένου XML αποτελεί σημαντική προϋπόθεση για τους εκδότες, τα αποθετήρια και τους διανομείς περιεχομένου όπως το JSTOR να δημιουργήσουν αποτελεσματικά πλούσια μεταδεδομένα.

Εκτός από την υποστήριξη της δημιουργίας πλούσιων μεταδεδομένων, τα αρχεία XML πλήρους κειμένου είναι επίσης πιο βολικά για ανάλυση κειμένου και δεδομένων, όπου χρησιμοποιούνται διαδικτυακά σενάρια ή εργαλεία μηχανικής μάθησης για την ανάκτηση πληροφοριών άρθρου. Για παράδειγμα, ένας επιστήμονας μπορεί να χρησιμοποιήσει ανάλυση κειμένου και δεδομένων για να συντάξει μια συλλογή άρθρων που συνδέονται με ένα συγκεκριμένο θέμα ή για να αναλύσει σχετικά σύνολα δεδομένων σε όλα τα άρθρα. Νέα εργαλεία μηχανικής εκμάθησης έχουν δείξει ότι ενώ είναι δυνατή η ανάλυση αρχείων PDF, είναι τεχνικά πολύ δύσκολο. Για παράδειγμα, το Scite αναλύει την αναφορά των άρθρων για να προσδιορίσει εάν η έρευνα υποστηρίζει ή έρχεται σε αντίθεση μεταξύ τους. Για το Scite και άλλα εργαλεία μηχανικής εκμάθησης, η μετακίνηση όλων των άρθρων σε μορφή αναγνώσιμη από μηχανή θα είναι ένα σημαντικό βήμα προς τα εμπρός. Σήμερα, πρέπει επίσης να αναλύσουν το PDF, καθώς τα αρχεία PDF είναι η κυρίαρχη μορφή δημοσίευσης.

Η ευέλικτη εμπειρία ανάγνωσης για διαφορετικές ανάγκες

Όταν εξετάζουμε τα πλεονεκτήματα και τα μειονεκτήματα του PDF, καθώς και άλλους τύπους αρχείων με δυνατότητα ανάγνωσης από ανθρώπινο και μηχάνημα, καθίσταται προφανές ότι κάθε τύπος αρχείου ικανοποιεί διαφορετικές ανάγκες. Το αρχείο PDF παραμένει η επιλογή για περιοδικά, η οποία μπορεί να δώσει στους αναγνώστες τη δυνατότητα να εκτυπώνουν εύκολα αντίγραφα των άρθρων. Αλλά για την αποτελεσματικότητα της διαδικασίας παραπομπής και της επεξεργασίας πληροφοριών, η δημοσίευση περιοδικών σε HTML και XML είναι υψίστης σημασίας.

Submit a Comment

Your email address will not be published. Required fields are marked *