Building with the Claude API — конспект курса Anthropic

Когда я прошла Claude 101, мне хотелось глубже. Как именно работает API? Почему разговор с Claude не сохраняется автоматически? Как дать модели инструменты для работы с внешними системами? Ответы на эти вопросы я нашла в курсе Building with the Claude API от Anthropic Academy.

Этот курс для тех, кто хочет не просто пользоваться Claude в веб-интерфейсе, а встраивать его в свои продукты и автоматизации. Даже если вы не программист, понимание этих принципов изменит то, как вы думаете об AI-системах.

Курс: Building with the Claude API Платформа: Anthropic Academy (anthropic.skilljar.com) Ссылка: anthropic.skilljar.com/claude-with-the-anthropic-api Длительность: ~2 часа Язык: English Бесплатно, с сертификатом Авторский конспект по материалам курса. Не является официальным переводом или публикацией Anthropic.

Как выбирать модель Claude под задачу?

Выбор модели определяет баланс качества, задержки и стоимости. Линейка и цены меняются, поэтому названия версий быстро устаревают. Надёжнее сравнивать актуальные модели на своём наборе задач.

Для оценки можно использовать четыре критерия:

Качество: насколько точно модель выполняет типовые задачи.
Скорость: подходит ли задержка для пользовательского сценария.
Стоимость: сколько стоит обработка реального объёма, а не одного теста.
Риск: где нужен более строгий контроль и человеческое подтверждение.

Например, простую классификацию и извлечение данных можно поручить более быстрой модели, а сложный анализ проверить на более способной. Выбор стоит подтверждать evals, а не предположением, что самая дорогая версия всегда нужна.

Почему Claude API stateless и что это значит для разработчика?

Главное открытие курса для меня: API не помнит предыдущие сообщения. Каждый запрос для Claude как новый разговор с незнакомцем. Веб-интерфейс claude.ai создаёт иллюзию памяти, но под капотом всё работает иначе.

Когда вы общаетесь в чате, интерфейс сохраняет историю сообщений и отправляет её целиком с каждым новым запросом. Если в разговоре 50 сообщений, все 50 отправляются на сервер каждый раз. Это называется multi-turn conversation, многоходовой разговор.

Почему это важно понимать? Контекстное окно ограничено и измеряется в токенах. Его точный размер зависит от актуальной модели, а история диалога, системные инструкции и документы занимают часть доступного объёма.

Anthropic предлагает несколько стратегий управления контекстом:

Summarization (суммаризация) — периодически просить модель сжать историю разговора в краткое резюме
Sliding window (скользящее окно) — хранить только последние N сообщений
RAG (retrieval) — хранить историю во внешней базе и извлекать релевантные фрагменты

Я использую комбинацию: для долгих проектов храню контекст в отдельных файлах (память агента), а в промпт загружаю только то, что нужно для текущей задачи. Это экономит токены и улучшает качество ответов, потому что модель не отвлекается на нерелевантную информацию.

Tool Use: как дать Claude инструменты для работы с внешним миром

Здесь начинается самое интересное. Tool use (использование инструментов) позволяет Claude взаимодействовать с внешними системами: API, базами данных, файлами, сервисами.

Как это работает? Вы описываете инструмент в формате JSON Schema: название, описание, параметры. Claude анализирует запрос пользователя и решает, какой инструмент вызвать и с какими параметрами. Вы получаете этот вызов, выполняете действие в реальном мире и возвращаете результат Claude. Модель формирует финальный ответ на основе полученных данных.

Пользователь: "Какая погода сегодня в Берлине?"
    ↓
Claude: "Мне нужно вызвать инструмент get_weather с параметром city='Берлин'"
    ↓
Ваш код: вызывает API погоды, получает данные
    ↓
Claude: формирует ответ на основе результата инструмента

Anthropic выделяет три типа инструментов:

Read-only — получение информации (погода, курсы валют, поиск в базе)
Write — изменение данных (создание записи, отправка сообщения)
Complex — многошаговые операции (бронирование с подтверждением)

Ключевой принцип: действия инструмента должны быть наблюдаемыми и соразмерными риску. Для чтения данных, записи и необратимых операций нужны разные уровни разрешений, логирования и подтверждения.

Например, инструмент для Google Sheets может читать таблицу, добавлять строки или обновлять статусы. Записывающие операции я логирую отдельно, чтобы видеть источник и содержание каждого изменения.

RAG: как научить Claude работать с вашими документами

RAG (Retrieval Augmented Generation) позволяет передавать модели релевантные фрагменты внешних документов. Внутренняя база знаний не появляется в контексте автоматически: её нужно проиндексировать, найти подходящие фрагменты и добавить к запросу.

Курс объясняет механику на понятном примере. Представьте юриста, который готовится к делу. Он не помнит все законы наизусть. Вместо этого он ищет релевантные статьи в правовой базе, выписывает нужные цитаты и на их основе строит аргументацию. RAG работает так же.

Три этапа RAG:

Indexing (индексация) — разбиваете документы на куски, создаёте векторные представления (embeddings)
Retrieval (поиск) — находите куски, семантически близкие к запросу пользователя
Generation (генерация) — передаёте найденные куски в промпт, модель отвечает на их основе

Главная боль RAG, которую курс честно проговаривает, это качество чанкинга (разбиения на куски). Если разрезать документ неправильно, модель получит обрывки без контекста. Абзац без заголовка, ответ без вопроса, цена без названия услуги.

Практические советы из курса:

Используйте перекрывающиеся куски (overlap), чтобы не терять контекст на границах
Сохраняйте метаданные: источник, дату, раздел
Сохраняйте ссылки на источники, чтобы выводы можно было проверить

Практический сценарий: поиск по внутренней базе знаний с инструкциями, справочными материалами и ответами на частые вопросы. Вместо загрузки всего массива система добавляет к запросу только найденные фрагменты и их источники.

MCP: универсальный стандарт для AI-интеграций

MCP (Model Context Protocol) Anthropic называют «USB-C для AI». Красивая метафора, и она точная. До USB-C каждое устройство требовало свой кабель. MCP создаёт единый стандарт для подключения AI-моделей к внешним системам.

Зачем это нужно? Без общего протокола каждое AI-приложение договаривается с интеграцией по-своему. MCP задаёт общий способ обнаружения и вызова возможностей, но совместимость конкретного сервера и клиента всё равно нужно проверять.

Архитектура MCP:

MCP Server — предоставляет инструменты и ресурсы (например, сервер для Google Sheets)
MCP Client — потребляет эти возможности (например, Claude Code)
Protocol — стандарт обмена данными между ними

Курс подчёркивает: MCP — открытый стандарт. Конкретный набор серверов и совместимых клиентов меняется, поэтому каждое подключение нужно отдельно оценивать по разрешениям, источнику и способу развёртывания.

В моей конфигурации MCP связывает Claude Code с рабочими источниками и инструментами. Это уменьшает ручное копирование, но не означает неограниченный доступ: каждый сервер получает только явно выданные разрешения.

Workflows vs Agents: когда автоматизация, а когда автономность

Курс вводит важное различие между двумя подходами к AI-системам.

Workflows (рабочие процессы) — заранее заданные цепочки действий. Шаг 1 → Шаг 2 → Шаг 3. Вы определяете порядок, ветвления и точки принятия решений. Такой процесс легче тестировать, хотя использование модели внутри него не делает результат полностью детерминированным.

Agents (агенты) — автономные системы, которые сами решают, что делать дальше. Агент получает цель, анализирует ситуацию, выбирает инструменты, выполняет действия, оценивает результат, корректирует курс. Агент адаптивен: может справиться с ситуацией, которую вы не предусмотрели.

Аспект	Workflow	Agent
Контроль	Полный, вы определяете каждый шаг	Частичный, агент принимает решения
Предсказуемость	Выше при фиксированных шагах	Ниже из-за выбора действий
Гибкость	Низкая (только предусмотренные сценарии)	Высокая (адаптация на лету)
Сложность	Проще отлаживать	Сложнее предсказать поведение
Применение	Рутинные повторяющиеся задачи	Исследования, творческие задачи

Когда что использовать?

Workflow — когда процесс понятен и повторяется. Например: забрать данные из таблицы → проверить обязательные поля → сформировать черновик → передать человеку на подтверждение.

Agent — когда задача требует исследования или адаптации. Анализ конкурентов, поиск решения проблемы, создание нового продукта. Агент может пойти неожиданным путём и найти решение, которое вы бы не предусмотрели.

Anthropic предупреждают: агентный подход гибче, но требует больше контроля. Нужны чёткие границы, механизмы остановки, логирование действий и человеческое подтверждение для рискованных операций.

Prompt Caching: экономия токенов на повторяющихся запросах

Практичная оптимизация, о которой многие не знают. Если вы отправляете Claude длинный системный промпт с каждым запросом (а вы отправляете, если работаете через API), вы платите за эти токены каждый раз.

Prompt Caching позволяет повторно использовать статичную часть контекста по сниженной стоимости. Точная экономия зависит от модели, объёма, срока жизни кэша и актуальных тарифов Anthropic.

Как это работает:

Помечаете часть промпта как cacheable (кэшируемую)
При первом запросе платите полную стоимость
При последующих запросах кэшированная часть стоит значительно дешевле

Где применять? Везде, где есть длинный статичный контекст:

Системные инструкции агента
База знаний компании
Примеры для few-shot learning
Документация продукта

Кэширование особенно полезно, когда один и тот же длинный системный контекст используется во многих запросах. Перед внедрением стоит сравнить стоимость на реальном трафике и учитывать правила истечения кэша.

Extended Thinking: когда модели нужно больше вычислений

Extended Thinking (расширенное мышление) выделяет модели дополнительный вычислительный бюджет перед финальным ответом. Это полезно для многошаговых задач, но не делает результат автоматически верным.

Зачем это нужно? Для сложных задач, где первый ответ часто ошибочен:

Математические расчёты
Логические головоломки
Анализ с множеством переменных
Код со сложной логикой
Стратегические решения

Точная настройка зависит от актуальной модели и версии API. Общий принцип курса: дополнительный бюджет оправдан там, где качество важнее задержки и стоимости, а результат можно проверить по ясным критериям.

Когда включать Extended Thinking:

Задачи с неочевидным решением
Ситуации, где важна точность, а не скорость
Анализ с множеством факторов

Когда не нужно:

Простые операции (форматирование, извлечение данных)
Задачи, где скорость критична
Массовая обработка однотипных запросов

Я использую этот режим для многофакторного анализа и сравнения вариантов. Для форматирования, извлечения данных и других простых операций он обычно избыточен.

Чему я научилась и что внедрила

После курса я пересмотрела архитектуру своих AI-систем. Вот что изменилось:

Выбор модели под задачу. Вместо одной модели для всех сценариев я разделяю классификацию, генерацию и сложный анализ, а затем сравниваю качество и стоимость на тестовом наборе.

Осознанное управление контекстом. Понимание stateless-природы API изменило то, как я структурирую промпты. Меньше истории, больше релевантного контекста.

MCP-интеграции. Подключила Google Sheets и Notion напрямую. Claude видит актуальные данные, не нужно копировать вручную.

Tool use для автоматизаций. Настроила инструменты для типовых операций: публикация, проверка, обновление статусов. Агент выполняет действия, я контролирую результат.

Кому подойдёт этот курс?

Курс технический, но доступный. Код показывают, но понимать его необязательно. Главное, это концепции.

Подойдёт:

Разработчикам, которые интегрируют AI в продукты
Маркетологам и предпринимателям, которые строят AI-автоматизации
Тем, кто прошёл Claude 101 и хочет глубже
Руководителям, которые оценивают возможности AI для бизнеса

Не подойдёт:

Тем, кто хочет просто пользоваться Claude в чате (достаточно Claude 101)
Тем, кто ищет готовые решения без понимания механики

Курс на английском, язык технический, но понятный. На момент моего прохождения курс и сертификат были бесплатными.

Серия «Учусь вместо вас»:

Claude 101
AI Fluency for Educators
Claude Code in Action, часть 1
Claude Code in Action, часть 2
Agent Skills, часть 1
Agent Skills, часть 2
Building with the Claude API ← вы здесь
Introduction to MCP

FAQ: вопросы о курсе

Нужно ли уметь программировать для прохождения курса?

Желательно понимать основы (что такое API, JSON, функции), но писать код не требуется. Курс объясняет концепции через диаграммы и примеры. Даже без опыта программирования вы поймёте, как работают AI-системы.

Чем этот курс отличается от Claude 101?

Claude 101 про использование Claude в веб-интерфейсе. Building with the Claude API про создание систем на базе Claude. Первый для пользователей, второй для создателей.

Можно ли применить знания без программиста?

Частично. Понимание моделей, RAG, tool use поможет грамотно ставить задачи разработчику. MCP-коннекторы можно подключить через Claude Code без написания кода. Но полноценная интеграция API требует разработки.

Есть ли практические задания?

Курс обзорный, без hands-on заданий. Но Anthropic предоставляют песочницу API, где можно экспериментировать после прохождения.

Сколько стоит использование Claude API?

Стоимость зависит от актуальной модели, объёма входных и выходных токенов, кэширования и дополнительных функций. Перед запуском лучше проверить текущие тарифы Anthropic и посчитать бюджет на реальном сценарии.

Если вы хотите внедрить Claude в свои процессы и не знаете, с чего начать, запишитесь на консультацию. Разберём ваши задачи, подберём архитектуру и инструменты под ваш бюджет.