Together AI进阶：使用Kotlin实现智能助手的核心功能

引言

随着人工智能技术的发展，智能助手已经成为我们日常生活中不可或缺的一部分。本文将带你使用Kotlin语言实现一个智能助手的核心功能，包括语音识别、自然语言处理和简单的对话管理。通过本教程，你将掌握如何构建一个基础但功能完整的AI助手。

准备工作

在开始之前，请确保你的开发环境满足以下要求：

JDK 11或更高版本
IntelliJ IDEA或Android Studio
Gradle构建工具
Together AI API密钥（可在官网注册获取）

项目依赖

在build.gradle.kts文件中添加以下依赖：

代码片段

dependencies {
    implementation("org.jetbrains.kotlinx:kotlinx-coroutines-core:1.6.4")
    implementation("com.squareup.okhttp3:okhttp:4.10.0")
    implementation("com.google.code.gson:gson:2.10")
}

第一步：设置Together AI客户端

首先我们需要创建一个与Together AI API交互的客户端类。

代码片段

import okhttp3.MediaType.Companion.toMediaType
import okhttp3.OkHttpClient
import okhttp3.Request
import okhttp3.RequestBody.Companion.toRequestBody

class TogetherAIClient(private val apiKey: String) {
    private val client = OkHttpClient()
    private val jsonMediaType = "application/json".toMediaType()

    // Together AI API端点
    private val apiUrl = "https://api.together.xyz/inference"

    suspend fun generateResponse(prompt: String): String {
        // 构造请求体
        val requestBody = """
        {
            "model": "togethercomputer/llama-2-70b-chat",
            "prompt": "$prompt",
            "max_tokens": 200,
            "temperature": 0.7,
            "top_p": 0.9,
            "repetition_penalty": 1.1
        }
        """.trimIndent()

        // 创建请求
        val request = Request.Builder()
            .url(apiUrl)
            .post(requestBody.toRequestBody(jsonMediaType))
            .addHeader("Authorization", "Bearer $apiKey")
            .build()

        // 发送请求并获取响应
        client.newCall(request).execute().use { response ->
            if (!response.isSuccessful) {
                throw Exception("API请求失败: ${response.code}")
            }

            return response.body?.string() ?: throw Exception("空响应")
        }
    }
}

代码解释：
1. TogetherAIClient类封装了与Together AI API的交互逻辑
2. generateResponse方法发送提示词(prompt)到API并返回生成的响应
3. OkHttp库用于处理HTTP请求和响应

注意事项：
– API密钥是敏感信息，不要硬编码在代码中，应该使用环境变量或配置文件
– suspend关键字表示这是一个协程函数，需要在协程作用域中调用

第二步：实现基础对话管理器

接下来我们创建一个简单的对话管理器来处理用户输入和AI响应。

代码片段

import com.google.gson.JsonParser

class DialogueManager(private val aiClient: TogetherAIClient) {
    // 解析API返回的JSON响应
    private fun parseResponse(jsonResponse: String): String {
        return try {
            val jsonObject = JsonParser.parseString(jsonResponse).asJsonObject
            jsonObject["output"]?.asJsonObject?.get("choices")?.asJsonArray?.get(0)
                ?.asJsonObject?.get("text")?.asString ?: "无法解析响应"
        } catch (e: Exception) {
            "解析错误: ${e.message}"
        }
    }

    // 处理用户输入并返回AI响应
    suspend fun processInput(userInput: String): String {
        // 构造上下文提示词，可以根据需要调整格式
        val prompt = """
        你是一个有帮助的AI助手。用户说:

        $userInput

        请用友好、专业的语气回复。
        """.trimIndent()

        val response = aiClient.generateResponse(prompt)
        return parseResponse(response)
    }
}

代码解释：
1. parseResponse方法解析Together AI返回的JSON格式响应，提取出文本内容
2. processInput方法构造提示词并调用AI客户端获取响应

实践经验：
– 提示词(prompt)的设计对AI输出的质量有很大影响，需要不断调整优化
– JSON解析使用Gson库，你也可以选择其他JSON处理库如kotlinx.serialization

第三步：创建主程序入口

现在我们将所有组件组合起来创建一个可运行的智能助手程序。

代码片段

import kotlinx.coroutines.runBlocking

fun main() {
    println("=== Kotlin智能助手 ===")

    // 从环境变量获取API密钥（实际项目中应该更安全地处理）
    val apiKey = System.getenv("TOGETHER_AI_API_KEY") ?: run {
        println("错误：未设置TOGETHER_AI_API_KEY环境变量")
        return
    }

    // 初始化组件
    val aiClient = TogetherAIClient(apiKey)
    val dialogueManager = DialogueManager(aiClient)

    while (true) {
        print("\n你：")
        val userInput = readlnOrNull() ?: break

        if (userInput.lowercase() == "exit") { 
            println("再见！") 
            break 
        }

        runBlocking { 
            try { 
                print("助手：")
                val response = dialogueManager.processInput(userInput)
                println(response)
            } catch (e: Exception) { 
                println("出错啦！${e.message}") 
            } 
        }
    }
}

代码解释：
1. main函数是程序的入口点，创建了一个简单的命令行交互界面
2. runBlocking创建了一个协程作用域来执行挂起函数（如我们的AI调用）
3. 用户可以输入”exit”退出程序

运行示例：

代码片段

=== Kotlin智能助手 ===

你：你好！
助手：您好！很高兴为您服务。有什么我可以帮助您的吗？

你：今天的天气怎么样？
助手：作为一个AI助手，我没有实时天气数据访问能力。建议您查看当地天气预报应用或网站获取最新天气信息。

进阶功能扩展

1. 添加对话历史记忆

为了使对话更加连贯，我们可以添加对话历史记忆功能：

代码片段

class DialogueManager(private val aiClient: TogetherAIClient) {
    private val conversationHistory = mutableListOf<String>()

    suspend fun processInput(userInput: String): String {
        conversationHistory.add("用户说: $userInput")

        // 构造包含历史记录的提示词（限制长度避免超出token限制）
        val historyContext = conversationHistory.takeLast(5).joinToString("\n")

val prompt = """
你是一个有帮助的AI助手。以下是最近的对话历史:

$historyContext

请用友好、专业的语气回复。
""".trimIndent()

val response = aiClient.generateResponse(prompt)
val aiResponse = parseResponse(response)

conversationHistory.add("助手说: $aiResponse")

return aiResponse
}
}

2. 添加语音输入输出（可选）

如果你想让智能助手支持语音交互，可以使用Android的SpeechRecognizer和TextToSpeech API：

代码片段

// Android环境下需要添加这些权限：
// <uses-permission android:name="android.permission.RECORD_AUDIO" />
// <uses-permission android:name="android.permission.INTERNET" />

class VoiceAssistant(
private val context: Context,
private val dialogueManager: DialogueManager ) : TextToSpeech.OnInitListener {

private lateinit var textToSpeech: TextToSpeech  
private lateinit var speechRecognizer: SpeechRecognizer  

init {  
textToSpeech = TextToSpeech(context, this)  
speechRecognizer = SpeechRecognizer.createSpeechRecognizer(context)  
}

override fun onInit(status: Int) {  
if (status == TextToSpeech.SUCCESS) {  
textToSpeech.language = Locale.getDefault()  
}  
}

fun startListening() {  
val intent = Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH)  
intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL, RecognizerIntent.LANGUAGE_MODEL_FREE_FORM)  

speechRecognizer.setRecognitionListener(object : RecognitionListener {  
override fun onResults(results: Bundle?) {  
results?.getStringArrayList(SpeechRecognizer.RESULTS_RECOGNITION)?.firstOrNull()?.let { userInput ->  
processVoiceInput(userInput)  
}  
}  

// ...其他必要的回调方法省略...  
})  

speechRecognizer.startListening(intent)  
}

private fun processVoiceInput(input: String) {  
GlobalScope.launch(Dispatchers.Main) {  
val response = dialogueManager.processInput(input)  
speakOut(response)  
}  
}

private fun speakOut(text:String){   
textToSpeech.speak(text, TextToSpeech.QUEUE_FLUSH, null, null)   
}  

fun release(){   
textToSpeech.shutdown()   
speechRecognizer.destroy()   
}   
}

常见问题解决

API请求超时

解决方案：增加OkHttp客户端的超时设置：

代码片段

private val client = OkHttpClient.Builder()
    .connectTimeout(30, TimeUnit.SECONDS)
    .readTimeout(30, TimeUnit.SECONDS)
    .writeTimeout(30, TimeUnit.SECONDS)
    .build()<br>

中文支持不佳
- 解决方案：
  - 在提示词中明确指定使用中文：”请用简体中文回答”
  - Together AI提供了专门的中文模型可以尝试：”togethercomputer/chinese-llama-2″
响应速度慢
- 解决方案：
  - 降低max_tokens参数值（减少生成文本长度）
  - temperature参数设置为0-0.5之间可以获得更确定性的结果

总结

通过本教程，我们实现了一个基于Kotlin和Together AI的智能助手核心功能：

API客户端 – OkHttp实现的Together AI接口调用封装
对话管理 – Prompt工程和简单的上下文记忆处理
主程序 – CLI界面和基本的错误处理逻辑

你可以在此基础上进一步扩展功能：
– [ ] Web界面或移动应用集成（Compose/Android）
– [ ] RAG增强检索能力（接入知识库）
– [ ] Function calling实现更复杂的任务自动化

完整的项目代码可以在GitHub仓库找到。

希望这篇教程能帮助你入门AI助手的开发！如果有任何问题欢迎在评论区讨论。