Ποια είναι τα συν και τα πλην του UTF-8;

Started by Nefeli, May 31, 2007, 04:54:24 AM

Previous topic - Next topic

Greek

Επαναφέρω το θέμα μετά από καιρό.
Απ' ότι έχω δει η κωδικοποίηση του SMF για UTF-8 έχει τύπο general_ci.
Απ' όσο έχω διαβάσει όμως, αυτός ο τύπος κωδικοποίησης αν και σχετικά γρήγορος, δεν είναι αρκετά ακριβής ως προς την απόδοση των χαρακτήρων.
Αντιθέτως η κωδικοποίηση unicode_ci παρ' ότι υστερεί κάπως σε ταχύτητα, εν τούτοις είναι πιο ακριβής ως προς την απόδοση των ειδικών χαρακτήρων.

Δεν ξέρω αν έπραξα σωστά, αλλά εκ των υστέρων μετέτρεψα την βάση από general_ci σε unicode_ci.

vkot

Η πολυγλωσσία δεν είναι ο μόνος λόγος για αλλαγή σε UTF-8. Ένας σημαντικός λόγος είναι η συμβατότητα με άλλες εφαρμογές που συνδέονται με το SMF: όχι μόνο mod του SMF αλλά και ανεξάρτητες εφαρμογές που συνδέονται με γέφυρες (αλλά και χωρίς γέφυρες, όταν θέλουμε πχ. με δικό μας script απλά να εμφανίζουμε περιεχόμενο της μιας εφαρμογής στην άλλη).

Στο site μου έχω SMF, php-nuke, και chat (ασύνδετo) με windows-1253. Επίσης, wiki και wordpress σε UTF-8. Σκοπεύω να μεταβώ σε joomla (που είναι σε UTF-8), σε σύνδεση με το SMF, και ίσως σε άλλο chat (UTF-8). Είχα συνηθίσει το windows-1253, αλλά αναγκαστικά πρέπει να πάω σε UTF-8 παντού στο site, κι έτσι θα μπορέσω εύκολα να κάνω την σύνδεση χρηστών και εμφάνιση περιεχομένου από τη μια εφαρμογή στην άλλη.
Δεν μπορώ να με φανταστώ να παραμένω σε windows-1253 έχοντας να μετατρέψω το joomla (και όχι μόνο) και τα όλα τα extensions που θέλω να χρησιμοποιήσω, σε windows-1253.

Βέβαια με στεναχωρεί λίγο που το SQL dump (του SMF μόνο) από ~600ΜΒ θα γίνει ~1GB, αλλά νομίζω ότι τελικά είναι μικρό το κακό.

Το θέμα με τα email σε UTF-8, υφίσταται ακόμα; Υπάρχουν ακόμα πολλά webmail που χρησιμοποιούν windows-1253;

Μια πρώτη δοκιμή για μετατροπή του φόρουμ, απέτυχε. Μου έβγαλε: ??????????. Θα το παλέψω όμως, πριν απευθυνθώ σε σας.

Greek,
Τι εννοείς με το "δεν είναι αρκετά ακριβής ως προς την απόδοση των χαρακτήρων";
For specialized SMF installation/customization, Web Development, Linux Server Administration, click here.
Για εξειδικευμένες υπηρεσίες στα παραπάνω, πατήστε εδώ.


GoofyX

... Morpheus: What is "real"? How do you define "real"? If you 're talking about what you can feel, what you can smell, what you can taste and see, then "real" is simply electrical signals interpreted by your brain...

Beelzeboss

Να ρωτήσω, αν εχουμε εγκατεστημενα τα greek utf-8 και το collation στη database ειναι κανονικα σε utf-8 general ci, θα πρεπει απαραιτητα να εγκαταστησουμε και τα english utf-8 ή μπορουμε και να μεινουμε και στα default english της smf που ειναι ISO-8859-1; Ευχαριστω.

GoofyX

Quote from: Beelzeboss on August 03, 2014, 11:14:06 AM
Να ρωτήσω, αν εχουμε εγκατεστημενα τα greek utf-8 και το collation στη database ειναι κανονικα σε utf-8 general ci, θα πρεπει απαραιτητα να εγκαταστησουμε και τα english utf-8 ή μπορουμε και να μεινουμε και στα default english της smf που ειναι ISO-8859-1; Ευχαριστω.

Τα αγγλικά είναι η μόνη γλώσσα που δεν «υπάρχει» σε iso ή utf-8, γιατί ακόμη και σε ascii character set, καλύπτεται. Άρα δεν έχεις να κάνεις κάτι. Με τα ελληνικά είναι το θέμα.
... Morpheus: What is "real"? How do you define "real"? If you 're talking about what you can feel, what you can smell, what you can taste and see, then "real" is simply electrical signals interpreted by your brain...

Beelzeboss

Quote from: GoofyX on August 03, 2014, 11:30:40 AM
Τα αγγλικά είναι η μόνη γλώσσα που δεν «υπάρχει» σε iso ή utf-8, γιατί ακόμη και σε ascii character set, καλύπτεται. Άρα δεν έχεις να κάνεις κάτι. Με τα ελληνικά είναι το θέμα.

Ειχα διαβασει παλιοτερα και εδω οτι το utf-8 επηρεαζει μονο τους μη λατινικους χαρακτηρες και αρα στα αγγλικα δεν θα παιζει καποιο ρολο αλλα ειχε παρει το ματι μου παλιοτερα τα english utf-8 και το ειχα απορια. Σε ευχαριστω για την απαντηση.

Και να ρωτησω και κατι αλλο σχετικο, στην database υπαρχουν καποια λιγα tables (εχουν δημιουργηθει απο τα mods) τα οποια ειναι σε latin1_swedish_ci αντι για utf8 general_ci που ειναι ολα τα υπολοιπα. Πρεπει να μετατραπουν ολα σε utf8 ή τα αφηνουμε ως εχει;

ΥΓ. Δεν εχω καποιο προβλημα στο forum. Απλα για την απορια.

GoofyX

Quote from: Beelzeboss on August 03, 2014, 11:51:00 AM
Και να ρωτησω και κατι αλλο σχετικο, στην database υπαρχουν καποια λιγα tables (εχουν δημιουργηθει απο τα mods) τα οποια ειναι σε latin1_swedish_ci αντι για utf8 general_ci που ειναι ολα τα υπολοιπα. Πρεπει να μετατραπουν ολα σε utf8 ή τα αφηνουμε ως εχει;

ΥΓ. Δεν εχω καποιο προβλημα στο forum. Απλα για την απορια.

Αν αυτοί οι πίνακες δεν περιέχουν κάποιο κείμενο που εμφανίζεται στο φόρουμ, λογικά δε θα έχεις πρόβλημα (όπως λες ότι δεν έχεις), άρα θα έλεγα μην το πειράζεις, άστο ως έχει. :)
... Morpheus: What is "real"? How do you define "real"? If you 're talking about what you can feel, what you can smell, what you can taste and see, then "real" is simply electrical signals interpreted by your brain...

Beelzeboss

Quote from: GoofyX on August 03, 2014, 11:54:26 AM
Αν αυτοί οι πίνακες δεν περιέχουν κάποιο κείμενο που εμφανίζεται στο φόρουμ, λογικά δε θα έχεις πρόβλημα (όπως λες ότι δεν έχεις), άρα θα έλεγα μην το πειράζεις, άστο ως έχει. :)

Περιεχουν λατινικους χαρακτηρες ή αριθμους (ip) αλλα θα ακολουθησω τη συμβουλη σου. ;) Οπως λεγεται, ο,τι δουλευει σωστα, δεν το πειραζουμε. :D

Darkness2000

Προσωπικά για εμένα το UTF-8 είναι καλό, αλλά ένα λάθος και μπορεί να βρεθείς από την Ελληνική γλώσσα σε κάτι σαν " Κινέζικα " και άντε μετά να

ξανά γράψεις όοολο το φόρουμ ( ενότητες - περιγραφή - δημοσιεύσεις ) απ' την αρχή...

Advertisement: