- 第一步:本地起一个 ES
- 第二步:Java 项目引入依赖
- 第三步:定义一个实体类
- 第四步:写个 Repository
- 第五步:试试写入和查询
- 遇到的问题 & 小技巧
- 最后说两句
最近我们团队开始在新项目里用 Elasticsearch(简称 ES),主要是为了做订单和用户的模糊搜索。以前用数据库 LIKE 查询,慢得要死,特别是数据量一大,用户搜个名字都卡半天。后来老大说:“试试 ES 吧,搞不好真香。” 我就硬着头皮上手了,结果发现——真的没那么难。
这篇文章就是我踩坑后整理的“人话版”入门指南,不讲原理,只讲怎么快速跑起来。目标是:10 分钟内,让你的 Java 项目能往 ES 里写数据、也能查出来。
第一步:本地起一个 ES
别一上来就想着集群、分片、副本。先本地跑起来再说。
我用的是 Docker,一行命令搞定:
docker run -d --name es -p9200:9200 -p9300:9300 -e"discovery.type=single-node"docker.elastic.co/elasticsearch/elasticsearch:8.12.0注意:ES 8 默认开启安全认证,对新手不太友好。如果你只是本地测试,可以加个环境变量关掉:
-e"xpack.security.enabled=false"
跑起来后,浏览器访问http://localhost:9200,看到一堆 JSON 信息,说明 OK 了。
第二步:Java 项目引入依赖
我们用的是 Spring Boot,所以直接加 starter:
<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-elasticsearch</artifactId></dependency>然后在application.yml里配一下地址:
spring:elasticsearch:uris:http://localhost:9200如果你关了安全认证,这样就行。如果开了,还得配用户名密码,但新手建议先关掉,省事。
第三步:定义一个实体类
假设我们要存“用户”信息,比如 ID、姓名、手机号、邮箱。
@Document(indexName="user")publicclassUser{@IdprivateStringid;privateStringname;privateStringphone;privateStringemail;// getter / setter 省略}这里关键就两行:
@Document(indexName = "user"):告诉 ES,这个类对应 ES 里的user索引(你可以理解成“表”)。@Id:主键,ES 会用它做文档 ID。
我们的经验是:字段名尽量用英文小写,别用下划线,避免映射出问题。
第四步:写个 Repository
Spring Data 给我们提供了超简单的操作方式:
publicinterfaceUserRepositoryextendsElasticsearchRepository<User,String>{// 按名字模糊搜List<User>findByNameContaining(Stringname);}就这一行!继承ElasticsearchRepository,泛型填你的实体类和 ID 类型,CRUD 方法都有了。
那个findByNameContaining是 Spring Data 的命名规则,意思是“名字包含 xxx”。ES 会自动转成全文检索,不用写查询语句。
第五步:试试写入和查询
写个测试方法:
@SpringBootTestclassEsTest{@AutowiredprivateUserRepositoryuserRepository;@TestvoidsaveUser(){Useruser=newUser();user.setId("1");user.setName("张三");user.setPhone("13800138000");user.setEmail("zhangsan@example.com");userRepository.save(user);}@TestvoidsearchUser(){List<User>users=userRepository.findByNameContaining("张");users.forEach(System.out::println);}}先跑saveUser(),再跑searchUser(),控制台应该能打出“张三”。
我认为:这比写 SQL 简单多了,尤其是模糊匹配,数据库要加%还可能走不到索引,ES 天然支持。
遇到的问题 & 小技巧
索引没自动创建?
Spring Data 默认会在第一次 save 时自动建索引。但如果字段类型复杂(比如嵌套对象),可能需要手动建 mapping。新手先用简单字段,基本没问题。中文搜不准?
默认的分词器对中文不友好。比如搜“张三”,可能拆成“张”和“三”,但如果你搜“张三丰”,可能就匹配不上。
我们的做法是:先用默认的跑通流程,等业务稳定了再单独处理中文分词(比如集成 ik 分词器)。别一上来就想完美,容易劝退。ID 到底用啥?
我们一般用业务主键(比如用户 ID 字符串),而不是让 ES 自动生成。这样方便和数据库对齐。
最后说两句
ES 确实强大,但新手最容易犯的错就是“想一口吃成胖子”——又是调分片,又是搞高亮,又是聚合分析……结果连最基础的增删改查都没跑通。
在我看来,先让它跑起来,能用就行。等真遇到性能问题或功能瓶颈,再深入优化。大部分中小项目,用默认配置 + 简单查询,已经能解决 90% 的搜索需求了。