Общие сведения о языке программирования С++

Что такое язык программирования?

Язык программирования — формальный язык, предназначенный для записи компьютерных программ. Язык программирования определяет набор лексических, синтаксических и семантических правил, определяющих внешний вид программы и действия, которые выполнит исполнитель (обычно — ЭВМ) под её управлением.
Программой называют алгоритм составленный на языке исполнителя. Далее под исполнителем мы будем понимать ЭВМ* (электронно-вычислительную машину).

*Примечание. Следует учитывать, что программы составляются не только для компьютеров.

Язык программирования (формальный язык) отличается от естественных языков тем, что предназначен для управления ЭВМ, в то время как естественные языки используются, для общения людей между собой. Большинство языков программирования использует специальные конструкции для определения и манипулирования структурами данных и управления процессом вычислений.
Со времени создания первых программируемых машин человечество придумало более восьми тысяч языков программирования (включая эзотерические, визуальные и игрушечные). Каждый год их число увеличивается. Некоторыми языками умеет пользоваться только небольшое число их собственных разработчиков, другие становятся известны миллионам людей. Профессиональные программисты могут владеть десятком и более разных языков программирования. (Подробнее)

Язык программирования С++

C++ (читается си-плюс-плюс) — компилируемый, статически типизированный язык программирования общего назначения, на котором можно создавать программы любого уровня сложности.
Более 20 лет этот язык находится в тройке самых популярных и востребованных языков программирования. (В этом можно убедиться, посетив сайт TIOBE).
Язык возник в начале 1980-х годов, когда сотрудник фирмы Bell Labs Бьёрн Страуструп придумал ряд усовершенствований к языку C под собственные нужды.

Bjarne Stroustrup - создатель языка C++

Bjarne Stroustrup – создатель языка C++

Страуструп решил дополнить язык C возможностями, имеющимися в языке Симула. Язык C, будучи базовым языком системы UNIX, на которой работали компьютеры Bell, является быстрым, многофункциональным и переносимым. Страуструп добавил к нему возможность работы с классами и объектами. В результате практические задачи моделирования оказались доступными для решения как с точки зрения времени разработки (благодаря использованию Симула-подобных классов), так и с точки зрения времени вычислений (благодаря быстродействию C).
Вот как об этом говорит сам разработчик языка:



В 1998 году был опубликован первый стандарт языка, известный как C++98, разработанный комитетом по стандартизации. C++ продолжает развиваться, чтобы отвечать современным требованиям. Одна из групп, разрабатывающих язык C++ и направляющих комитету по стандартизации C++ предложения по его улучшению — это Boost, которая занимается, в том числе, совершенствованием возможностей языка путём добавления в него особенностей метапрограммирования. Последний стандарт вышел в 2017 году и носит наименование С++17. Следующий стандарт не заставит себя долго ждать и появится, как ожидают, в 2020 году.
Никто не обладает правами на язык C++, он является свободным. В марте 2016 года в России была создана рабочая группа РГ21 С++. Группа была организована для сбора предложений к стандарту C++, отправки их в комитет и защиты на общих собраниях Международной организации по стандартизации.
С++ – это мультипарадигмальный язык (от слова парадигма – стиль написания компьютерных программ), включающий широкий спектр различных стилей и технологий программирования. Часто его причисляют к объектно-ориентированным языкам, но, строго говоря, это не так. В процессе работы разработчик получает абсолютную свободу в выборе инструментов для того, чтобы задача, решаемая с помощью того или иного подхода, была решена максимально эффективно. Иными словами, С++ не понуждает программиста придерживаться только одного стиля разработки программы (например, объектно-ориентированного).
Синтаксис C++ унаследован от языка C. Одним из принципов разработки было сохранение совместимости с C. Тем не менее, C++ не является в строгом смысле надмножеством C. Со временем, практическая совместимость между языками C и C++ постепенно будет утрачиваться, так как языки разрабатывают разные группы по стандартизации, не взаимодействующие друг с другом.
C++ повлиял на многие языки программирования, в их числе: Java, C#, D.
C++ имеет богатую стандартную библиотеку, которая включает в себя распространённые контейнеры и алгоритмы, ввод-вывод, регулярные выражения, поддержку многопоточности и другие возможности. (Подробнее)
За время своего существования за языком С++ закрепились устойчивые мифы, которые легко опровергаются (см. здесь: Часть1 и Часть2)

Алфавит языка (п. 3.1.1)

Алфавит языка C++ составляют символы включенные в 7-битную кодировку ISO 646/ECMA-6:
space, !, ", %, &, (, ), *, +, -, ., /, 0..9, :, ;, <, =, >, ?, A..Z, _, a..z.
Тем не менее, часть символов, используемых в алфавите C++, не входит в кодовую базу этой кодировки: {, }, [, ], #, \, ^, |, ~.

Лексема

Символы алфавита образуют лексемы. Лексема (token) - это минимальная единица языка, имеющая самостоятельный смысл. Лексемы - формируют базовый словарь языка, понятный компилятору. Всего существует пять видов лексем:

  • Ключевые слова (keywords)
  • Идентификаторы (identifiers)
  • Литералы (literals)
  • Операции (operators)
  • Знаки пунктуации (разделители, punctuators)
Лексемы (как и слова в естественном языке) разделяются непечатаемыми (пробельными) символами (пробел, символы табуляции, перевода строки, возврат каретки, перевода страницы) и знаками пунктуации: [, ], (, ), {, }, *, ,, :, =, ;, ..., #.

Ключевые слова

Ключевые слова (уч. - служебные слова) - это лексемы специального назначения. Они зарезервированы, использовать их в качестве идентификаторов (имен объектов программы) запрещено. Список ключевых слов см. в методичке (Таблица 3).

Идентификаторы

Идентификатор - это имя программного объекта: переменной, константы, массива, функции, класса и т. п. В идентификаторах могут использоваться латинские буквы, цифры и знак нижнего подчеркивания ( _ ). В C++ различаются строчные и прописные буквы (т. е. имена регистро-зависимы), так: Name, name и NAME - это разные идентификаторы. Правила использования идентификаторов:

  1. можно использовать латинские символы: A..Z, a..z;
  2. можно использовать арабские цифры: 0..9 и символ нижнего подчеркивания, но не в начале;
  3. пробелы в имени не допускаются;
  4. не рекомендуется начинать с нижнего подчеркивания или с двух нижних подчеркиваний и заглавной буквы, например: _S (такие идентификаторы имеют специальное назначение);
  5. двойное подчеркивание используется только для служебных целей to__boo
  6. не допускается использования ключевых слов;
  7. необходимо воздерживаться от использования ключевых слов, как части имени, например: for_and_if (за исключением наименования типов)

При составлении имен желательно придерживаться какого-либо стиля, например, стиля CamelCase: имена пишутся слитно, каждое слово, описывающее назначение идентификатора, пишется с заглавной буквы. Этот стиль используется в двух вариантах: UpperCamelCase и lowerCamelCase. Первый используется для именования классов, второй для прочего: переменных, методов и т.п.

Литералы

Литералы, иначе константы - это неизменяемые величины. Примеры различных констант:

Целые

0, -1, 10000
По умолчанию целочисленные лексемы имеют тип int.
Представление целых литералов в различных системах счисления:
Двоичной: 0b1010, 0B111100111
Восьмеричной: 01, 020, 07155
Шестнадцатеричной: 0xA, 0x1B8, 0X00FF

Действительные

С фиксированной точкой: 5.7, .001, -35., 0.0
С плавающей точкой (экспоненциальный): -0.2E6, .11e-3, 5E10, 2.e-10
По умолчанию они имеют тип double.

Примечание: стандарт C++14 ввёл использование апострофа для произвольного разделения разрядов в числовых литералах:
0b0100’1100’0110, 0.000’015’3
Символьные

Один или два символа заключенные в апострофы: 'S', 'щ', '\t', '\012', '\x07\x07', 'db'

Примечание: к символьным константам относятся специальные управляющие символы (escape-последовательности).
Escape-последовательности

Escape-последовательности (или управляющие последовательности) используются для описания определённых специальных символов внутри строковых литералов, то есть внутри ограничителей "". Полный список приведен в методичке (Таб. 12). Вот некоторые из них:
\n - новая строка
\t - горизонтальная табуляция
\v - вертикальная табуляция
\0 - нулевой символ
Например: "Ветер на море гуляет\nИ кораблик подгоняет;\nОн бежит себе в волнах\nНа раздутых парусах."

Строковые

Последовательность символов, заключенные в кавычки:
"Hello world!", "Здесь был Вася :-))"
В стандарте C++17 символьные литералы представлены в единой кодировке UTF-8.

Примечание: к строковому литералу автоматически добавляется признак конца строки ('\0').
Прочие

Булевские (логические): false, true
и другие, с которыми мы познакомимся позднее.
В заключение добавим, что целые, действительные и строковые литералы используют специальные суффиксы, приказывающие компилятору изменить представление типов данных (используемых по умолчанию), примеры использования суффиксов мы покажем во время более близкого знакомства с типами данных.

Комментарии

Комментарии служат для описания и документирования исходного кода. В C++ применяются два вида комментариев: многострочный и однострочный. Например:

/* Многострочный комментарий часто используется
   для заголовков в описании исходного кода */

// Однострочный комментарий используется в пределах одной строки
// но также может быть использован для описания алгоритма

В комментариях можно использовать любые, доступные в среде, символы - компилятор игнорирует содержимое закомментированного блока или строки.

Типы данных (п. 3.1.2)

Описание фундаментальных (уч. - простых) типов см. в методичке (Таблицы 6, 7 и 8).

Структура программы на языке C++

Для составления программы необходимо создать текстовый файл с именем main.cpp (он создается автоматически, если вы создаете проект в интегрированной среде программирования Code::Blocks). Минимальное содержимое этого файла должно быть следующим:
Программа 8.1.1

int main() {
    // Это пустая программа
}
Примечание. Алгоритм создания проекта в среде Code::Blocks изложен в методичке здесь.

В С++ main() называется главной функцией программы. В ней осуществляется реализация основного алгоритма программы: вызовы функций, обращения к объектам библиотечных и пользовательских классов, инициализация, ввод и вывод данных, взаимодействие с операционной системой.
После компиляции и запуска этой программы появится консольное окно содержащее только служебную информацию от среды разработки. Поскольку в теле главной функции не реализован какой-либо алгоритм, то и программа не выводит никаких полезных данных. Чтобы в консольном окне появился, например, текст приветствия, программу необходимо дополнить следующими инструкциями и директивами:
Программа 8.1.2

#include <iostream>
using namespace std;
 
int main() {
    cout << "Здравствуй, мир!" << endl;
    return 0;
}

Для вывода строки нам потребуется включить (с помощью директивы #include) библиотечный класс iostream, содержащий функции ввода/вывода. Исторически так сложилось, что библиотечный класс ввода/вывода автоматически не включается в программу. Для вывода символьной строки необходимо использовать объект потока cout и операцию вставки "<<" (два символа "меньше", следующих друг за другом, без пробела). Символьная строка должна быть заключена в двойные кавычки. Завершает вывод данных манипулятор endl (end line - конец строки). Заканчивается программа инструкцией return (возврат значения). Инструкция return является необязательной (поскольку программа, в случае её отсутствия, будет возвращать значения операционной системе не явно). Но мы возьмем за хороший навык всегда использовать эту инструкцию в конце программы. Возвращаемое значение - 0 (признак успешного завершения). Обратите внимание, что любая инструкция (предложение языка) в C++ должно заканчиваться точкой с запятой.
Объявление

using namespace std;

говорит о том, что мы будем использовать пространство имен стандартной библиотеки (STD). Это позволит сделать код более лаконичным. В противном случае, строка 5 выглядела бы следующим образом:

std::cout << "Здравствуй, мир!" << std::endl;

Операция присваивания (п. 3.4.1)

Для операции присваивания в C++ используется символ '='

Вопросы и задания

  1. Что такое лексема, перечислите все виды лексем
  2. Какие фундаментальные типы данных вы знаете?
  3. Почкму C++ является мультипарадигмальным языком?
  4. Какие существуют правила для идентификаторов?
  5. Что такое литералы? Какие литералы используются в C++?
  6. Что такое комментарий, какие виды комментариев используются в C++?

Темы сообщений

  1. История С++
  2. Критика C++. Обоснованность критики
  3. Мифы о C++
  4. Типы данных в C++
  5. Интегрированные среды разработки на C++
Print Friendly, PDF & Email

Comments are closed.