SMF Support > Ελληνικά (Greek)

Ποιά είναι τα συν και τα πλην του UTF-8;

(1/5) > >>

Nefeli:
Αναρωτιέμαι καιρό τώρα για τα πλεονεκτήματα και τα μειονεκτήματα της κωδικοποίησης UTF-8.

Η κωδικοποίηση windows-1253 που τρέχω στο φόρουμ και στο πόρταλ, λειτουργούν μια χαρά για τις ανάγκες μου όσον αφορά την "εμβέλεια" του site σε γλώσσες, ωστόσο υστερεί σημαντικά όταν περνάω κάποιες άλλες λειτουργίες με διαφορετικές κωδικοποιήσεις. Αν υπολογίσει κανείς και τις ιδιαιτερότητες των φυλλομετρητών ως προς αυτές, καταλαβαίνει εύκολα το κομφούζιο που δημιουργείται. Δεν είναι εύκολο, ούτε διασκεδαστικό, να χάνει κανείς ώρες επί ωρών για τις ρυθμίσεις και αυτές να είναι τελικά δυσλειτουργικές αφού δεν έχουν ένα "global" χαρακτήρα, αφού πρέπει να εξηγείς και σε κάθε χρήστη τι πρέπει να κάνει για να "βλέπει" τη κάθε λειτουργία.

Στο διαδίκτυο κυκλοφορούν διιστάμενες απόψεις. Η μία θέλει την utf-8 ως το μέλλον των κωδικοποιήσεων και η άλλη την απεύχεται, χωρίς να έχω καταλάβει τους λόγους.

Θα μπορούσα, θα μου πείτε, να δοκιμάσω στο φόρουμ τη μετατροπή σε utf-8, μια δοκιμή πείθει το καθένα.
Θα το έκανα αν δεν ήξερα πως είναι μια λειτουργία ΜΗ αντιστρέψιμη! (κάνω μήπως λάθος;)
Έτσι δεν το έχω τολμήσει ποτέ αν και υποψιάζομαι πως είναι ίσως η λύση στο πρόβλημά μου.

Χρειάζομαι λοιπόν περισσότερα "στοιχεία", υπέρ ή κατά, από τη δική σας εμπειρία με ή άνευ utf-8, ώστε να αποκτήσω επιτέλους κριτήριο για το αν θέλω να παραμείνω στην  windows-1253 ή να το γυρίσω στην utf-8.

Μπορείτε να με βοηθήσετε;

Nefeli:
Διάβασα επίσης και το UTF-8 Readme όπως και το UTF-8 vs ISO, το οποίο βρήκα πολύ πολύ χρήσιμο.

Υπογραμμίζω μόνο τα εξής:


--- Quote ---Why would I need UTF-8? ....... If the software integrating with SMF uses UTF-8. In some cases such an integration can require character sets to match.
--- End quote ---
είναι το πιο ισχυρό μου κίνητρο. Ένα πρόβλημα που περιορίζεται είναι η αλήθεια στα μέλη που διαβάζουν με IE και όχι με Firefox.


--- Quote ---Το μειονέκτημα είναι ότι θα σου πιάνει (σχεδόν) διπλάσιο χώρο, γιατί η κωδικοποίηση ενός όχι λατινικού χαρακτήρα (πχ. ελληνικά, κινέζικα, κτλ.) θα πιάνει 2 bytes, αντί για 1 στην περίπτωση του ISO-8859-7. Διπλάσιος χώρος και στο αρχείο μηνυμάτων και στη βάση και στο output (άρα περισσότερο bandwidth).
--- End quote ---


Η ερώτησή μου λοιπόν διαμορφώνεται ως εξής:

Όταν λέμε διπλάσιος χώρος, μικρότερη ταχύτητα, ακριβολογούμε ή είναι μόνο μια έκφραση;

Κι αν είναι απλή έκφραση, για ποιες διαφοροποιήσεις μεγεθών σε αναλογία μιλάμε;

Το "διπλάσιο" πχ αφορά στο σύνολο των δεδομένων του site; Από 50 θα γίνει 100;;;;;

Κι αν δεν περάσω εγώ παρά τα Ελληνικά, Αγγλικά, Γαλλικά άντε και Γερμανικά, θα έχω το ίδιο ακριβώς αποτέλεσμα στην αύξηση του μεγέθους;;;;  ::)

agridoc:

--- Quote ---Η κωδικοποίηση windows-1253 που τρέχω στο φόρουμ και στο πόρταλ, λειτουργούν μια χαρά για τις ανάγκες μου όσον αφορά την "εμβέλεια" του site σε γλώσσες, ωστόσο υστερεί σημαντικά όταν περνάω κάποιες άλλες λειτουργίες με διαφορετικές κωδικοποιήσεις. Αν υπολογίσει κανείς και τις ιδιαιτερότητες των φυλλομετρητών ως προς αυτές, καταλαβαίνει εύκολα το κομφούζιο που δημιουργείται. Δεν είναι εύκολο, ούτε διασκεδαστικό, να χάνει κανείς ώρες επί ωρών για τις ρυθμίσεις και αυτές να είναι τελικά δυσλειτουργικές αφού δεν έχουν ένα "global" χαρακτήρα, αφού πρέπει να εξηγείς και σε κάθε χρήστη τι πρέπει να κάνει για να "βλέπει" τη κάθε λειτουργία.
--- End quote ---

Nefeli δεν κατάλαβα τι ακριβώς εννοείς, ιδιαίτερα το

--- Quote ---αφού πρέπει να εξηγείς και σε κάθε χρήστη τι πρέπει να κάνει για να "βλέπει" τη κάθε λειτουργία
--- End quote ---

Nefeli:
Στις εικόνες που επισυνάπτω αν προσέξεις φαίνονται οι διαφορές στις περιοχές του μενού και των ονομάτων των κατηγοριών αφ ενός και στη περιοχή του σουτμποξ από την άλλη, στους δύο  βασικούς φυλλομετρητές (έχω το σηματάκι του καθενός για να ξεχωρίζει).

Αν φτιάξω τη κωδικοποίηση του coppermine σε greek ISO 8859-7 αντί του utf-8 που είναι η προεπιλογή και σε "συμφωνία" με το smf και tiny, παίρνω το σουτμποξ σε ελληνικά αλλά όλο το πάνελ του coppermine σε τρέχα γύρευε σύμβολα!

Το πρόβλημα όμως δεν σταματάει εκεί. Η λύση του να βγάλω τελείως το σουτμποξ από τη κεντρική του coppermine είναι μια κουτσή λύση μια που όταν πάω να μεταφέρω δεδομένα από το coppermine στα blocks της κεντρικής σελίδας του tiny, (για παράδειγμα τα ονόματα ή τις κατηγορίες των εικόνων) αυτά φαίνονται τελείως ακαταλαβίστικα!

Όσον αφορά στην ερώτηση σου Agridoc :

 
--- Quote ---Nefeli δεν κατάλαβα τι ακριβώς εννοείς, ιδιαίτερα το
Quote
αφού πρέπει να εξηγείς και σε κάθε χρήστη τι πρέπει να κάνει για να "βλέπει" τη κάθε λειτουργία
--- End quote ---

Εννοώ πως στη περίπτωση πχ του ΙΕ, μπορεί κανείς να κάνει δεξί κλικ μέσα στο πλαίσιο του σουτμποξ, και να πάρει τα Ελληνικά ως αποτέλεσμα μιας "τοπικής" αλλαγής κωδικοποίησης. Αυτό όμως ισχύει μέχρι την επόμενη ανανέωση της σελίδας.

Είναι λοιπόν απαραίτητο να τρέχουν τα πάντα σε κοινή κωδικοποίηση. Αλλιώς τα προβλήματα είναι πάρα πολλά. Το πρόβλημα μου είναι αν πρέπει να διαλέξω όλα ISO ή UTF-8. Έχω και εγώ συγχιστεί πολύ με όλη την ιστορία.

Όπως και να έχει, θέλω να καταλάβω σε βάθος τη κατάσταση μια που οτιδήποτε άλλο μου φαίνεται σαν τα "σκουπίδια μου κάτω από το χαλί" :) ή αλλιώς στρουθοκαμηλισμός.

Προσθήκη:
Δεν μπορώ να υποχρεώσω κανένα να τρέχει μόνο Firefox κι ακόμη, δεν έχω τους υπόλοιπους φυλλομετρητές για να ελέγξω το εκεί αποτέλεσμα!

agridoc:

--- Quote ---Είναι λοιπόν απαραίτητο να τρέχουν τα πάντα σε κοινή κωδικοποίηση.
--- End quote ---
Σωστό σαν βάση, όχι απαραίτητο πάντοτε.

Ολα είναι θέμα προγραμματισμού και όλα εξελίσσονται. Ενα πρόγραμμα που απευθύνεται παγκόσμια πρέπει να έχει λύσεις για όλες τις κωδικοποιήσεις αλλά και τα συστήματα γραφής (υπάρχει και το από δεξιά προς αριστερά). Αυτό όμως δεν συμβαίνει πάντα. Ο κώδικας έχει λάθη ή παραλείψεις ή ακόμα και πλεονάζοντα στοιχεία κώδικα που δημιουργούν προβλήματα ή περιορισμούς κατά περίπτωση.

Εχω δώσει αλλού την παρακάτω απάντησηΑναλόγως τι θέλει να κάνει κανείς.

Για ελληνικά συγχρόνως με γλώσσες που έχουν λατινικό αλφάβητο ISO 8859-7 ή Windows-1253. Αν κάποιος θέλει συγχρόνως και μια άλλη γλώσσα με άλλο, μη λατινικό αλφάβητο (π.χ. κυριλλικό) και πολλά μηνύματα UTF-8.

Με τo ISO 8859-7 το database θα είναι μικρότερο και εφ' όσον και στο PC μου έχω Windows-1253 με βολεύει για την επεξεργασία HTML, PHP και άλλων αρχείων.

Θα επικρατήσει το UTF-8; Νομίζω οτι έχει πια καθιερωθεί αλλά αμφιβάλλω αν θα καταφέρει να επικρατήσει. Ο κυριότερος λόγος είναι τα εκατομμύρια των PC που λειτουργούν σ' όλο τον κόσμο με τοπικό codepage και η αγοραστική τους δύναμη όπως και οι απαιτήσεις τους για την χρήση των υπολογιστών τους.

Τα προγράμματα προσαρμόζονται ανάλογα με τις απαιτήσεις μας. Για να πουλήσουν σε χώρες με τοπικό codepage πρέπει να λειτουργούν και με αυτό.

Γενικά: Ελληνικό codepage.
Γιατί: Γιατί έτσι με βολεύει καλύτερα.
Μα θεωρητικά δεν είναι το πιο σωστό: Σκασίλα μου, εφ' όσον λειτουργεί εντάξει.
Οσον αφορά το μέγεθος της βάσης, αν ο κύριος όγκος είναι στα Ελληνικά είναι σημαντική η διαφορά, αν είναι στα Αγγλικά όχι.

Navigation

[0] Message Index

[#] Next page

Go to full version