Строка формата в регистр заголовка

Как отформатировать строку в регистр заголовка?

Ответов (20)

Если используемый вами язык имеет поддерживаемый метод / функцию, просто используйте его (как в ToTitleCase методе C# ).

Если это не так, вам нужно сделать что-то вроде следующего:

  1. Прочтите в строке
  2. Взять первое слово
  3. Сделать первую букву этого слова заглавной 1
  4. Идите вперед и найдите следующее слово
  5. Перейти к 3, если не в конце строки, в противном случае выйти

1 Чтобы использовать его, скажем, в C - используйте коды ascii, чтобы найти целое значение символа и вычтите из него 32.

В коде потребуется гораздо больше проверок ошибок (обеспечение допустимых букв и т. Д.), А функция «Заглавные буквы» должна будет наложить на буквы своего рода «схему заглавных букв», чтобы проверять слова, в которых нет необходимости. быть capatilised ('и', 'но' и т. д. Вот хорошая схема)

С Perl вы можете сделать это:

my $tc_string = join ' ', map { ucfirst($\_) } split /\s+/, $string;

http://titlecase.com/ имеет API

Вот реализация на Python: https://launchpad.net/titlecase.py

И порт этой реализации, которую я только что сделал на C++: http://codepad.org/RrfcsZzO

В Java вы можете использовать следующий код.

public String titleCase(String str) {
    char[] chars = str.toCharArray();
    for (int i = 0; i < chars.length; i++) {
        if (i == 0) {
            chars[i] = Character.toUpperCase(chars[i]);
        } else if ((i + 1) < chars.length && chars[i] == ' ') {
            chars[i + 1] = Character.toUpperCase(chars[i + 1]);
        }
    }
    return new String(chars);
}

Вот простой пример того, как это сделать:

public static string ToTitleCaseInvariant(string str)
{
    return System.Threading.Thread.CurrentThread.CurrentCulture.TextInfo.ToTitleCase(str);
}

В C#

using System.Globalization;  
using System.Threading;  
protected void Page_Load(object sender, EventArgs e)  
{  
  CultureInfo cultureInfo   = Thread.CurrentThread.CurrentCulture;  
  TextInfo textInfo = cultureInfo.TextInfo;  
  Response.Write(textInfo.ToTitleCase("WelcometoHome<br />"));  
  Response.Write(textInfo.ToTitleCase("Welcome to Home"));  
Response.Write(textInfo.ToTitleCase("[email protected]$home<br/>").Replace("@","").Replace("$", ""));  
}

В C# вы можете просто использовать

CultureInfo.InvariantCulture.TextInfo.ToTitleCase(str.ToLowerInvariant())
  • Инвариантный
  • Работает со строками в верхнем регистре

На каком языке?

В PHP это:

ucwords ()

пример:

$HelloWorld = ucwords('hello world');

Вот простой статический метод сделать это на C#:

public static string ToTitleCaseInvariant(string targetString)
{
    return System.Threading.Thread.CurrentThread.CurrentCulture.TextInfo.ToTitleCase(targetString);
}

Без использования готовой функции суперпростой низкоуровневый алгоритм преобразования строки в регистр заголовка:


convert first character to uppercase.
for each character in string,
    if the previous character is whitespace,
        convert character to uppercase.

Это предполагает, что «преобразование символа в верхний регистр» будет делать это правильно независимо от того, чувствителен ли символ к регистру (например, '+').

Вот решение Perl http://daringfireball.net/2008/05/title_case

Вот решение Ruby http://frankschmitt.org/projects/title-case

Вот однострочное решение Ruby: http://snippets.dzone.com/posts/show/4702

'some string here'.gsub(/\b\w/){$&.upcase}

В однострочном выражении первый символ каждого слова заменяется регулярным выражением на его версию в верхнем регистре.

Я бы опасался автоматического преобразования всех слов с пробелами в начале в сценариях, в которых я рискую вызвать ярость придирчивых.

Я бы хотя бы подумал о создании словаря для исключительных случаев, таких как статьи и союзы. Вот:

"Красавица и Чудовище"

А когда дело доходит до имен собственных, все становится намного уродливее.

Чтобы записать его, скажем, на C - используйте коды ascii ( http://www.asciitable.com/ ), чтобы найти целочисленное значение символа и вычтите из него 32.

Это плохое решение, если вы когда-либо планируете принимать символы за пределами AZ и AZ.

Например: ASCII 134: å, 143 ASCII: Å.
Используя арифметику, вы получите: ASCII 102: f

Используйте вызовы библиотеки, не думайте, что вы можете использовать целочисленную арифметику для своих персонажей, чтобы получить что-то полезное. Юникод - это непросто .

Вот вам версия на C++. В нем есть набор слов без прописных букв, таких как местоимения и предлоги. Однако я бы не рекомендовал автоматизировать этот процесс, если вы имеете дело с важными текстами.

#include <iostream>
#include <string>
#include <vector>
#include <cctype>
#include <set>

using namespace std;

typedef vector<pair<string, int> > subDivision;
set<string> nonUpperCaseAble;

subDivision split(string & cadena, string delim = " "){
    subDivision retorno;
    int pos, inic = 0;
    while((pos = cadena.find_first_of(delim, inic)) != cadena.npos){
        if(pos-inic > 0){
            retorno.push_back(make_pair(cadena.substr(inic, pos-inic), inic));
        }
        inic = pos+1;
    }
    if(inic != cadena.length()){
        retorno.push_back(make_pair(cadena.substr(inic, cadena.length() - inic), inic));
    }
    return retorno;
}

string firstUpper (string & pal){
    pal[0] = toupper(pal[0]);
    return pal;
}

int main()
{
    nonUpperCaseAble.insert("the");
    nonUpperCaseAble.insert("of");
    nonUpperCaseAble.insert("in");
    // ...

    string linea, resultado;
    cout << "Type the line you want to convert: " << endl;
    getline(cin, linea);

    subDivision trozos = split(linea);
    for(int i = 0; i < trozos.size(); i++){
        if(trozos[i].second == 0)
        {
            resultado += firstUpper(trozos[i].first);
        }
        else if (linea[trozos[i].second-1] == ' ')
        {
            if(nonUpperCaseAble.find(trozos[i].first) == nonUpperCaseAble.end())
            {
                resultado += " " + firstUpper(trozos[i].first);
            }else{
                resultado += " " + trozos[i].first;
            }
        }
        else
        {
            resultado += trozos[i].first;
        }       
    }

    cout << resultado << endl;
    getchar();
    return 0;
}

В Perl:

$string =~ s/(\w+)/\u\L$1/g;

Это даже в FAQ.

I think using the CultureInfo is not always reliable, this the simple and handy way to manipulate string manually:

string sourceName = txtTextBox.Text.ToLower();
string destinationName = sourceName[0].ToUpper();

for (int i = 0; i < (sourceName.Length - 1); i++) {
  if (sourceName[i + 1] == "")  {
    destinationName += sourceName[i + 1];
  }
  else {
    destinationName += sourceName[i + 1];
  }
}
txtTextBox.Text = desinationName;

В PROPER(n) Excel есть встроенная формула .

Был очень рад видеть, что мне не пришлось писать это самому!

В Silverlight нет ToTitleCase в TextInfo классе.

Вот простой способ на основе регулярных выражений.

Примечание. В Silverlight нет предварительно скомпилированных регулярных выражений, но для меня эта потеря производительности не является проблемой.

    public string TitleCase(string str)
    {
        return Regex.Replace(str, @"\w+", (m) =>
        {
            string tmp = m.Value;
            return char.ToUpper(tmp[0]) + tmp.Substring(1, tmp.Length - 1).ToLower();
        });
    }

Как в Excel ПРАВИЛЬНО:

public static string ExcelProper(string s) {
    bool upper_needed = true;
    string result = "";
    foreach (char c in s) {
        bool is_letter = Char.IsLetter(c);
        if (is_letter)
            if (upper_needed)
                result += Char.ToUpper(c);
            else
                result += Char.ToLower(c);
        else
            result += c;
        upper_needed = !is_letter;
    }
    return result;
}